数据加速器 GooseFS 1.4 版本正式发布

这篇具有很好参考价值的文章主要介绍了数据加速器 GooseFS 1.4 版本正式发布。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

腾讯云存储团队正式发布数据加速器 GooseFS 1.4 版本(含 GooseFS 1.4.0 和 GooseFS 1.4.1 版本),该版本针对 AI、大数据场景提供了文件解压缩等便捷易用的工具,同时针对海量文件读写下的集群性能和稳定性问题进行了针对性优化,提升了产品竞争力。

重点更新点一:提供文件解压缩能力

 AI 场景下,业务团队可能会将大量用于训练或者学习的文件打包成一个压缩包并上传到对象存储中;在执行训练或者学习任务时,再将压缩包文件下载到本地并解压。这一流程会对底层对象存储服务产生较大的读带宽,每次启动任务时,无论需要读取多少文件,都需要将文件所处的压缩包整包下载才可以执行。

GooseFS 在本次更新中联合 COS 服务提供了服务端的解压缩能力,支持通过解压缩工具向 COS 服务端发起解压缩请求,提升文件访问性能。GooseFS 支持文件解压缩能力的基本框架如下:

数据加速器 GooseFS 1.4 版本正式发布


整体流程上:
1. 首先通过 GooseFS 解压缩指令`goosefs fs decompress`向 COS 服务发起指定文件的解压缩请求。
2. COS 服务收到解压缩请求后,会向解压缩服务模块提交解压缩任务,由文件加压缩模块管理任务进度。
3. 解压缩过程中,用户可以通过`goosefs fs queryDecompress`指令查询解压缩任务的状态。
4. 解压缩任务完成后,完成解压后的文件会输出至用户指定的文件目录中。
5. 支持通过`goosefs fs listDecompressJobs <namespace>`指令查阅指定命名空间的解压缩任务进展。
 

GooseFS 提供的解压缩能力目前仍然在公测阶段,公测阶段有地域和可用区限制,但暂不进行收费,如需使用可以提交工单申请。

使用 GooseFS 文件解压缩能力的优势如下:
1. 避免文件读放大问题,减少底层对象存储服务的读带宽。用户在服务端侧完成解压缩后,只需按需读取需要用到的文件,无需读取整个压缩包。
2. 减少客户端侧的 CPU 压力。用户无需在客户端侧执行解压缩操作,可以让宝贵的计算资源聚焦在 AI 计算任务上。
 

重点更新点二:支持临时密钥主动热更新

GooseFS通过托管在集群中的密钥访问远端的对象存储服务。腾讯云的永久密钥具备永久的有效期,临时密钥的有效期则可以由用户自行指定,最长不超过 2 小时。在 GooseFS 集群中托管永久密钥存在一定的安全风险,比如当永久密钥泄露时,对象存储服务中的文件将持续存在泄露的风险。因此在本次更新中,GooseFS 团队提供了临时密钥托管的模式。


通过临时密钥托管服务,用户可以只在 Worker 节点上缓存从 Master 节点拉取的临时密钥信息,并通过临时密钥访问远端对象存储服务,获取业务所需数据。GooseFS 支持临时秘钥托管服务的整体框架如下所示:

数据加速器 GooseFS 1.4 版本正式发布

整体流程上:
1. 在 Worker 节点中,可以周期性地通过以下指令,变更节点上的临时密钥信息。

`goosefs ns update <namespace> [--secret <key=value>] [--attribute fs.cosn.userinfo.sessionToken=xxx]`

2. 客户端读取文件时,如果文件未缓存在 Worker 节点上,Worker 节点可以通过临时密钥访问远端对象存储服务拉取文件。

使用 GooseFS 临时密钥托管主要可以减少密钥泄露带来的安全风险。GooseFS 集群中可能管理成百上千台 Worker 节点,每一台 Worker 节点中都持久化永久密钥大大增加了密钥泄露的概率,使用临时密钥可以极大缓解此类风险。
 

重点更新点三:GooseFS-FUSE客户端支持降级读

GooseFS-FUSE 可以在一台 Unix 机器上的本地文件系统中挂载一个 GooseFS 分布式文件系统。通过使用该特性,一些标准的命令行工具(例如 ls、cat 以及 echo)可以直接访问 GooseFS 分布式文件系统中的数据。GooseFS-FUSE 在访问 GooseFS 时,需要先到 GooseFS 集群中获取缓存文件,如果文件不存在,GooseFS 会到远端对象存储服务上拉取文件。如果 GooseFS 集群的 Master 节点异常(比如 Standalone 模式的 Master 节点宕机,HA 模式的多节点主备切换),导致集群整体不可用时,GooseFS-FUSE 将无法读取到文件,导致客户端也不可用。


GooseFS-FUSE 客户端在本期更新中新增了降级读能力,可以在 Master 节点异常时透传 FUSE 客户端的请求到远端对象存储服务上,这一能力有助于提升客户端整体的可用性。

整体流程上:

1.默认情况下,GooseFS-FUSE 默认会去 Master 节点获取文件元数据信息,并读取 GooseFS 集群中的文件;

2.节点异常的情况下,GooseFS-FUSE 会启用降级读模式,直接去远端对象存储中读取文件。

其他更新点

除了上述更新之外,我们在本次版本中优化了 GooseFS 的产品性能和稳定性,进一步提升 GooseFS 在大数据、AI 场景下的集群稳定性。主要更新点如下:

1. GooseFS distributedLoad 能力支持层级遍历能力,支持递归拉取指定目录下的元数据信息。(GooseFS 1.4.0)
2. FUSE 随机读性能优化。(GooseFS 1.4.0)
3. 增加 Master 查询/更新 RocksDB 的分位耗时监控,提升元数据服务的监控灵敏度。(GooseFS 1.4.0)
4. 优化了 GooseFS HA模式下的集群恢复时间,提升了集群可用性。(GooseFS 1.4.0)
5. CosN 依赖版本升级,支持通过原生 HDFS 协议访问开启元数据加速的存储桶,提升大数据场景下的文件操作性能。(GooseFS 1.4.0)
6. GooseFS 配置精简优化,减少了不必要的配置项,提升了配置易用性。(GooseFS 1.4.0)
7. listInfo 精简优化。(GooseFS 1.4.0)
8. 大文件顺序读优化。(GooseFS 1.4.0)
9. 支持清理和查看未完成文件列表(GooseFS 1.4.1)
10. 优化递归加载元数据(loadmetadata -R)操作加锁粒度(GooseFS 1.4.1)

同时,GooseFS 1.4  版本还修复了若干问题,其中存在潜在稳定性风险的重要修复点如下:
1. 修复 Worker 接收大量无效 async block 的请求。(GooseFS 1.4.0)
2. 优化 Worker 上报时对孤立 block 的处理逻辑。(GooseFS 1.4.0)
3. 修复 Flume 写入场景认证流和数据流状态统一问题。(GooseFS 1.4.1)
4. 修复大文件写入耗尽客户端资源后死锁的问题。(GooseFS 1.4.1)文章来源地址https://www.toymoban.com/news/detail-474758.html

到了这里,关于数据加速器 GooseFS 1.4 版本正式发布的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Github镜像加速器-FastGit

    FastGit  是一个对于  GitHub.com  的镜像加速器。使用共享资源为  GitHub  加速。 FastGit中文指南 关于 FastGit 的使用,本质上与 git 有关。常规的面向 GitHub 的 clone 命令可能如下: 使用 FastGit 时,可使用如下命令: 正如您所见, FastGit 仅仅是 GitHub 的代理,所以我们仅需要替换

    2024年01月16日
    浏览(95)
  • 阿里云Docker镜像加速器

    阿里云Docker镜像加速器详解: Docker 镜像 仓库 容器介绍 以及镜像仓库详解 访问 https://www.aliyun.com/ 搜索 “容器镜像服务”

    2024年04月25日
    浏览(46)
  • docker配置阿里云镜像加速器

    docker配置阿里云镜像加速,可以极大的提高docker镜像下载速度,配置非常简单,了解一下 登录自己的阿里云账号,然后选择控制台 我是CentOS

    2024年02月11日
    浏览(67)
  • 连接鲨鱼加速器出现错误解决方法

    连接加速器出现651错误 连接加速器出现721错误 连接加速器出现619错误 Win7系统加速器出现734错误 xbox360连接加速器出错,连不上 XP连接加速器800错误 PS3连接加速器出现DNS错误 用网络加速器是否需要宽带支持 软件是手动换线还是自动换线? iPhone手机如何设置l2tp? Android|安卓

    2024年02月06日
    浏览(97)
  • Docker基础(三)—配置镜像加速器

    我们的镜像加速器用阿里云来作为示例 1、首先,我们进入阿里云云原生官网(http://ttps://promotion.aliyun.com) 2、注册一个账号,不注册用淘宝账号也可以使用 3、点击控制台 4、选择容器镜像服务 5、选择个人版,有条件的话,可以选择企业版  6、选择创建个人版  7、创建后,

    2023年04月08日
    浏览(49)
  • Docker概念、安装以及配置镜像加速器

    (给自己文章打个call)如果对于linux比较陌生的可以看一看这些文章 Linux安装MySQL、JDK(含环境变量配置)、Tomcat Linux介绍以及常用操作命令 Linux中vi编辑器使用及ps系统管理命令 (1)从VM与Docker框架中,直观上VM多了一层Guest OS,同时Hypervisor会对硬件资源进行虚拟化,docker直接

    2024年02月02日
    浏览(97)
  • GPU如何成为AI的加速器

    目录 0. 前言 1. 从显卡的诞生说起 2. GPU粉墨登场 3. 渲染——让计算机图像更逼真 4. 从GPU到GPGPU 5. CUDA——奠定了NVIDIA成为寡头的基础 6. 未来不只有GPU 20231122更新 0. 前言 按照国际惯例,首先声明:本文只是我自己学习的理解,虽然参考了他人的宝贵见解,但是内容可能存在不

    2024年02月08日
    浏览(42)
  • Centos7 配置Docker镜像加速器

    docker实战(一):centos7 yum安装docker docker实战(二):基础命令篇 docker实战(三):docker网络模式(超详细) docker实战(四):docker架构原理 docker实战(五):docker镜像及仓库配置 docker实战(六):docker 网络及数据卷设置 docker实战(七):docker 性质及版本选择 认知升维: 道、法、术、器、势   daemon.json

    2024年02月12日
    浏览(55)
  • 【Docker】从零开始:6.配置镜像加速器

    镜像加速器是一个位于Docker Hub之前的缓存服务器,用于加速Docker镜像的下载。当我们配置了镜像加速器后,从Docker Hub下载镜像时,Docker将首先尝试从加速器服务器下载镜像,如果加速器服务器上没有该镜像,则会从Docker Hub下载。 Docker加速器是一种工具,可以加速Docker镜像的

    2024年02月05日
    浏览(53)
  • 1.安装 docker 容器并配置镜像加速器

    1.2.1 实验环境准备 实验环境: rockylinux8.8    可以去官网下载 下载 Rocky | Rocky Linux 主机名: xuegod63 主机 ip: 192.168.1.63(这个 ip 大家可以根据自己所在环境去配置,配置成静态 IP) 2g 内存、2vCPU、50G 硬盘 1、配置静态 ip 和主机名 1)把 ip 配置成静态的 配置文件 /etc/sysconfig/

    2024年02月07日
    浏览(52)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包