TStor OneCOS 技术专栏——轻松单桶万亿

这篇具有很好参考价值的文章主要介绍了TStor OneCOS 技术专栏——轻松单桶万亿。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

TStor OneCOS简介

TStor OneCOS海量对象存储(后面简称OneCOS),是基于腾讯云公有云存储架构打造的完全自研的分布式软件定义存储,轻松支持单桶万亿对象和EB级容量,集群容量无限伸缩,同时支持高密大盘等多种硬件机型。本期我们来聊聊单桶万亿对象数的核心能力。

背景

云计算、5G、大数据、AI等创新技术的快速发展,引发了海量非结构化数据的规模化聚集,数百PB容量或千百亿数量的海量数据存储需求变得越发普遍。

以智能汽车自动驾驶训练场景为例:一辆汽车约搭载8个摄像头,包括前向3颗、周视4颗、后视1颗,每个摄像头以30帧/秒的速度拍摄12小时,将会产生约1036万多帧的图片,如果保存近1年100辆车的数据,就是接近3800亿的数据。即使对数据进行自动化过滤处理,剩下需要精确标注的数量仍然非常惊人,这还不包括除摄像头之外其他传感器和流程的数据。

        onecosw,解决方案,腾讯云,云计算,TStor,TStor OneCOS

 

某汽车厂商最初使用公有云对象存储,存储量已经达到千亿对象数,存在单桶超过百亿文件数的桶。现在由于合规、成本等因素选择自建私有云对象存储全量替换云上对象。由于业务使用便利和配置效率,要求存储文件桶必须和云上一样的划分命名,核心要求就是单桶对象数规模和云上一致,单桶需要支持超过千亿的对象数,以满足未来数据持续增长。

主流存储厂商为了保证存储的性能、稳定性及可靠性,通常会对单集群、单个桶等规格做出限制,拥有海量数据的客户随业务增长需要拆分多个集群,大大降低了使用效率,同时也增加了管理和运维的复杂度。

OneCOS天然适应这种大规模海量数据需求,和公有云COS一致,每个存储桶中最大对象数不限。如某用户单桶超过55PB、总文件数超过5000亿:

onecosw,解决方案,腾讯云,云计算,TStor,TStor OneCOS

数据和索引存储分离

首先,OneCOS通过把对象内容的存储和元数据的存储的解耦,做成两套独立的系统,并且每个系统对外的接口尽量的简单,高内聚低耦合,方便各个系统独立演进和迭代。元数据存储和对象内容存储分离的结构如下图:

onecosw,解决方案,腾讯云,云计算,TStor,TStor OneCOS

        

OneCOS引入了全局统一的分布式元数据集群,使用一套元数据存储系统真正意义上解决了单存储桶规模的局限性。在对象存储系统中,既要存储对象的内容也要存储对象的元数据,这两个存储对系统的要求是不一样的,对象内容的存储在接口上只需要上传、下载、删除就可以了,并且对象的内容一般都比较大,在存储的时候需要做切分;而对象的元数据,一般value都比较小,并且元数据的操作在接口上除了增加、删除、查询之后,还需要支持有序的list操作,另外元数据的操作还要有一定的事务的能力,以支持用户对同一个对象的多并发的操作等。

索引存储支持多个表空间    

OneCOS的元数据存储在业务上支持不同的表空间,比如说上传中的对象、已删除的对象、上传完成的对象是在不同的表空间中。OneCOS元数据的表空间类似于数据库中的表,每个表空间是相互独立的,在访问元数据的时候需要先指定表空间。

onecosw,解决方案,腾讯云,云计算,TStor,TStor OneCOS

通过表空间这一层的抽象,使元数据在逻辑的组织上更加的清晰,方便对不同的表空间施加不同的存储优化和QoS访问控制等。

hash加range的数据组织形式

OneCOS对象存储对外的ListObjects接口要求对象的列表要能顺序的列出,很显然这个要求对象的列表在底层存储的时候要按照顺序来存储,OneCOS也是这样做的,但同时不同的存储桶之间并不需要按照全局的顺序来存储,因此OneCOS这边最终的存储方案是按照hash加range的方式来组织元数据的。对appid和bucket,按照hash来打散,对某个存储桶的对象列表,按照range有序的存储到某些小表中,并且当小表比较大时,支持分裂成多个小表,并在整个索引元数据集群中均衡分布。

       

onecosw,解决方案,腾讯云,云计算,TStor,TStor OneCOS

另外考虑有的存储桶使用时间作为对象名称的使用场景,比如说存储桶中存储的是日志文件,日志文件是按照时间来命名的,这样元数据按照range有序来存储对象列表的时候会发现新对象的上传总是在range最后的一个小区间中,对应到元数据存储的某单个小表上,这样这个小区间对应的小表就会成为整个存储桶的瓶颈,虽然存储桶很大,但是上传的key在range中比较集中,会导致元数据单小表的能力成为整个bucket的瓶颈。为了应对这种场景,OneCOS在分hash和range的时候,也支持在对象名上做hash,这样可以把热点的对象在小表上打散,提升存储桶整体的性能。为了应对对象列表hash打散对list操作的性能影响,OneCOS逻辑层针对list的操作做了多路并发的缓存和加速。

cas事务支持的能力   

在大规模对象的处理上不可避免的会遇到冲突的问题,比如说多个并发同时在上传、删除、下载同一个对象,OneCOS通过分表空间以及单key的cas能力来保证冲突处理过程中的正确性。

对象索引表空间的key是对象的名称,value指向数据索引;数据索引表空间的key是数据的unique key,value指向这个数据在底层存储上的相关的信息。租户的每次上传操作都对应唯一的一个数据索引,上传完成之后,再通过cas的操作更新对象索引表空间中这个对象的指向。通过这种方式来解决多路并发对同一个对象操作冲突的处理。

综上,OneCOS单桶支持万亿对象的能力,具有绝对领先的私有云和混合云数据存储优势,和公有云规格无缝衔接,可以轻松帮助数据中心快速实现真正的海量云存储,确保满足未来数据需求。文章来源地址https://www.toymoban.com/news/detail-784164.html

到了这里,关于TStor OneCOS 技术专栏——轻松单桶万亿的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 800份智慧城市数字化转型智慧能源人工智能数据治理综合解决方案(专栏内下载)

    61页工业互联网零碳园区建设方案PPT 企业数字化转型大数据湖一体化平台项目建设方案PPT 50页数字化转型数据架构规划设计--方法论及案例 算网一体技术创新与实践 2023工业互联网数字化中台解决方案PPT 937页39万字智能矿山项目建设整体解决方案(煤矿) word资料 18万字XX市应急

    2024年02月04日
    浏览(56)
  • 精通AI领域技术实战千例专栏—学习人工智能的指南宝典

    PC端可直接搜索 快捷键: Ctrl+F 应用领域、项目、比赛名称、技术类型等等 注意看本文目录-快速了解本专栏 🎉🎊🎉 你的技术旅程将在这里启航! 🚀 本专栏:精通AI领域技术实战千例专栏 从基础到实践,深入学习。无论你是初学者还是经

    2024年02月05日
    浏览(59)
  • 轻量级报表解决方案Telerik Reporting,轻松完成嵌入式报表交互!

    开发者可以通过多种方式与集成在应用程序中的Telerik报表进行交互,从“只是阅读它”到更改报表中包含的数据。 但是要注意:开发者所能做的一些事情将取决于报表是如何创建的,以及它是如何嵌入到应用程序UI中的。因此(和任何应用程序一样),为了从Telerik报表中获得想

    2024年02月08日
    浏览(56)
  • 电脑连上wifi但显示无网解决方案分享,轻松搞定电脑上网问题

    有的时候我们会遇到这样的问题:电脑明明连接了网络但仍不能上网,并且出现错误提示“WiFi已连接但没有互联网”。遇到这种情况,我们可以先使用另一台设备访问网络,看看你能否正常上网。如果也不能上网,可以尝试重新启动 wifi路由器。如果问题仍未解决,请参考以

    2024年02月16日
    浏览(34)
  • 怎么解决win10电脑桌面图标右下角有黑色方块的问题!轻松修复桌面图标显示异常!【解决方案分享】

    1、今天突然发现电脑桌面的快捷图标左下角有黑色方块,显得很难看,又无从下手,直接上图看。 2、网上找了很多方法说是 “这是缓存出错引起的,用下面的软件修复一下(下载360卫士选电脑门诊或电脑援救/系统图标/图标显示异常修复,如果是磁盘图标出错,选本地磁盘

    2024年02月10日
    浏览(61)
  • ChatGPT-4 Vision 催生万亿产业

      (做了多年视觉分析,谨以忐忑的心情写下本文) 2023年9月25日,微软发布ChatGPT-Vision的研究报告(文章末尾有下载地址),同日openai发布重要更新:听,说,看。 2023年10月3日,openai发布Dall-E3.0。距离ChatGPT获得全部人类技能,还差触觉,嗅觉和味觉。 听,说基于文本,D

    2024年02月08日
    浏览(34)
  • 比特币突然暴拉:跻身1万亿

    作者:秦晋 比特币时隔2年,市值再度突破1万亿美元。迈过一个牛市关键坎儿。14年前2月14日,中本聪曾在一封内部邮件中表示「20年后,比特币要么会有非常大的交易量,要么就没有交易量。」 2月14日,是一个中国迎财神与西方情人节相互交加的特殊的日子。比特币当天上

    2024年02月19日
    浏览(30)
  • 大厂案例 - 腾讯万亿级 Elasticsearch 架构实践

    Elasticsearch(ES)作为首选的开源分布式搜索分析引擎,通过一套系统轻松满足用户的日志实时分析、全文检索、时序数据分析等多种需求,大幅降低大数据时代发掘数据价值的成本。 腾讯在公司内部丰富的场景中大规模使用 ES,同时联合 Elastic 公司在腾讯云上提供内核增强版

    2024年02月14日
    浏览(36)
  • 微信万亿数据仓库架构设计与实现

    安全策略开发流程 安全业务的核心逻辑在安全策略中实现。整个的策略开发流程包括特征数据的收集,安全策略的编写实现,和策略的反馈评估。其中特征数据的收集是必不可少的环节,数据的质量将直接影响安全策略的效果。 特征数据收集 主要包括:数据接入、特征的计

    2024年02月16日
    浏览(35)
  • 美SEC大乌龙 震惊1.7万亿市场

    作者:秦晋 美国SEC制造了2024开年首个大乌龙事件。 北京时间1月10日凌晨,美国SEC在社交媒体X上发文表示,「今天美国证券交易委员会批准比特币ETF在所有注册的国家证券交易所上市。批准的比特币ETF将接受持续的监督和合规措施,以确保持续保护投资者。」 该消息发布后

    2024年02月01日
    浏览(27)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包