PB级区块链开源存储引擎“泓”Huge

这篇具有很好参考价值的文章主要介绍了PB级区块链开源存储引擎“泓”Huge。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

区块链的特有属性使数据可追溯、不可篡改的同时弊端也很明显,采用的分布式存储技术需要每一个节点保存一份数据库,存储成本高;网络中发生的每笔交易都需要其它节点认证和记录,处理速度慢;这让区块链的系统的存储效率相较集中式存储受到诟病。作为数字经济新型信息基础设施,区块链需面对全国乃至全球的用户带来的海量数据上链存储需求。

长安链从超大规模数据存储场景出发,推出 PB 级区块链开源存储引擎“”,英文名定为“Huge”,预计将在 2022 年底正式开源。泓在保证区块链系统中数据一致性和唯一性外还将具备:大规模、低成本、高性能、强隐私的特点。

效率成本兼容

采用混合式存储架构、数据分片、冷热分离等技术,具备海量数据存储能力,兼顾效率和成本。

1.混合式存储架构

区块链上存储的数据有多种不同读写特性,比如:区块和交易这类数据一旦写入就不再修改,且数据量大,适合采用文件存储,同时对文件中的数据项创建索引以方便查询;而状态数据需要频繁修改与查询,适合采用KV数据库或OLTP类(联机事务处理 Online Transaction Processing)的数据库;对于合约事件这类需要进行数据分析的场景,也可以采用OLAP类(联机分析处理 Online Analytical Processing)的存储系统;对于区块链以区块为单位的批量处理流程,我们采用预写式日志(WAL)加内存缓存的方式来优化存储效率。因此泓基于混合式的存储架构来实现。混合式存储需要解决多个不同存储系统之间的数据一致性问题,我们采用区块作为检查点,来实现不同存储系统之间的异常校验与数据自动恢复。

2.数据分片

要面向海量数据,区块链存储系统必须具备水平扩展能力,基于我们混合存储架构中的数据一致性管理能力,可以将区块数据拆分成更细粒度的数据项进行存储,使得系统中的不同存储组件都可以实现分片能力,可以兼容市面上常用的分布式存储服务,包括:分布式文件存储,分布式数据库等。

3.冷热分离

区块链要求数据可追溯,需要保存全量的历史数据,通过对数据进行冷热分级,可以兼顾性能和成本。对于近期写入的区块、交易、热点状态数据可以定义为热点数据,通过对热点缓存到内存中,来提升效率。对于某个区块高度之前(某个时间戳之前)的历史数据称为冷数据,冷数据可以归档转移到成本更低,容量更大的网络存储中。同时对冷数据可以通过去中心化文件存储(如IPFS InterPlanetary File System 星际文件系统 )进行共享,使得多个节点共用一套存储服务。如果热数据与冷数据比例为1:9,并且块存储和文件存储成本为3:1,那么用了归档,可以把90%的旧区块,归档到成本只有33%的文件存储中。从而节省60%的存储成本。在PB级场景中,一年节省600万以上的成本。

性能安全并进

泓面向大数据量采用多种方式提升数据处理性能及安全性,持续释放大数据价值。

1.两阶段提交,并行处理提升性能

存储模块不是一个独立运行的系统,需要和长安链共识模块、核心模块、虚拟机模块等配合,以组成一个完整的区块链系统。泓与长安链共识模块、核心模块、虚拟机模块等充分适配,在长安链共识产生新区块的过程中,存储模块采用“两阶段提交”,并行处理提升性能。

2.先写缓存后异步写入分布式数据库

为了提升写入区块的性能,同时保证读到已提交数据的事务隔离级别,长安链采用先写缓存后异步写入分布式数据库的模式。当一个新区块对应的数据需要写入数据库时,系统将数据写入内存中的缓存区域,并开启一个后台线程,按顺序将缓存区域数据写入数据库,此时系统便可正常返回,从而达到快速写和支持读已提交数据的要求。

3.交易ID过滤器,加速交易防重检查

提升交易查重性能方面,泓提供了3个过滤系统来实现交易查重,用户可以基于自己的场景自定义选配是否开启,配合使用会极大的提高交易防重检查的效率。

4.透明数据加密,保障存储安全

为了增强区块链落盘后的数据安全,应对硬盘被盗、黑客入侵系统或内部IT人员违规操作等情形,长安链提供了透明数据加密特性。该特性可以基于硬件密码机也可以基于软件加解密,区块链数据在落盘时自动加密,在读取数据时自动解密,增强了数据安全。

结  语

泓将在AIot、工业互联网、金融的大数据量的场景下发挥作用,也可以对元宇宙、web3等新技术场景提供支撑。泓包含10余个主要模块,预计将于2022年底正式开源,后续将对主要模块进行介绍。文章来源地址https://www.toymoban.com/news/detail-798404.html

到了这里,关于PB级区块链开源存储引擎“泓”Huge的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Java远程连接本地开源分布式搜索引擎ElasticSearch

    简单几步,结合Cpolar内网穿透工具实现Java远程连接操作本地Elasticsearch。 什么是elasticsearch?一个开源的分布式搜索引擎,具备非常多强大功能,可以用来实现搜索、日志统计、分析、系统监控等功能,可以帮助我们从海量数据中快速找到需要的内容。 Cpolar内网穿透提供了更高

    2024年02月05日
    浏览(50)
  • 鹏云网络分布式块存储社区版问世,首发开源存储解决方案

          2023年1月,南京鹏云网络科技有限公司(简称:鹏云网络)正式宣布开源ZettaStor DBS分布式块存储系统,开放了自研10余年的分布式块存储技术,自此踏上了“自研”与“开源”一体并行的生态闭环之路。 研发十年,挑战块存技术上限       成本、效率、高可用,一直

    2024年02月11日
    浏览(39)
  • 开源分布式搜索引擎ElasticSearch结合内网穿透远程连接

    简单几步,结合Cpolar 内网穿透工具实现Java 远程连接操作本地分布式搜索和数据分析引擎Elasticsearch。 Cpolar内网穿透提供了更高的安全性和隐私保护,通过使用加密通信通道,Cpolar技术可以确保数据传输的安全性,这为用户和团队提供了更可靠的保护,使他们能够放心地处理和

    2024年02月04日
    浏览(50)
  • 探索Garnet:微软开源的高性能分布式缓存存储系统

    微软研究院近期宣布推出一款名为Garnet的创新开源分布式缓存存储系统,致力于解决现代应用程序在处理大规模数据时对于高吞吐量、低延迟及卓越可扩展性的严苛要求。这款基于C# .NET 8.0构建的新型系统,充分利用了现代硬件能力,为应用程序开发人员提供了加速数据访问

    2024年04月26日
    浏览(55)
  • 对象存储分布式代理-go初学者的开源练手项目

    最近写了一个go语言练手项目osproxy和osproxy-grpc,代码已完全开源到github。 相信不少接触go语言的读者,都是被它\\\"极简协程\\\",“高并发”,\\\"高性能\\\"的特性所吸引,我也不例外,想着学完之后,能快速上手享受一把。 但当我看完基本语法,想找个练手项目时,才发现github上大

    2024年02月08日
    浏览(47)
  • Hadoop是一个开源的分布式处理系统,主要用于处理和存储大量数据

    Hadoop是一个开源的分布式处理系统,主要用于处理和存储大量数据。它是由Apache软件基金会开发的,现在已经成为大数据领域中广泛使用的技术之一。 Hadoop架构 Hadoop的架构包括以下几个主要组件: Hadoop Distributed File System (HDFS) : HDFS是Hadoop的核心组件之一,它是一个分布式文

    2024年02月04日
    浏览(58)
  • 结合云计算的最新技术和现状,介绍云计算基础知识、开源分布式数据库Clickhouse、可视化数据分析工具、分布式链路跟踪系统Pinpoint、数据湖存储系统Pulsar等

    作者:禅与计算机程序设计艺术 2019年,“云计算”将成为“经济全球化”的热门词汇之一,2020年全球云计算市场规模预计达到1万亿美元。中国是继美国、英国之后,成为全球第四大云服务提供商。华为、腾讯、阿里巴巴等互联网巨头纷纷布局云计算领域,各家公司纷纷推出

    2024年02月08日
    浏览(56)
  • 第19关 5.2k star 开源分布式存储服务Rancher-Longhorn在k8s上部署

    ------ 课程视频同步分享在今日头条和B站 大家好,我是博哥爱运维。 什么是Longhorn Longhorn是一个轻量级、可靠且易于使用的Kubernetes分布式块存储系统。 Longhorn 是免费的开源软件。它最初由 Rancher Labs 开发,现在作为云原生计算基金会的孵化项目进行开发。 官方文档: https:

    2024年02月04日
    浏览(45)
  • 【分布式】分布式存储架构

    说到分布式存储,我们先来看一下传统的存储是怎么个样子。 传统的存储也称为集中式存储, 从概念上可以看出来是具有集中性的,也就是整个存储是集中在一个系统中的,但集中式存储并不是一个单独的设备,是集中在一套系统当中的多个设备,比如下图中的 EMC 存储就需

    2024年02月10日
    浏览(53)
  • 【分布式技术】分布式存储ceph之RBD块存储部署

    目录 创建 Ceph 块存储系统 RBD 接口 服务端操作 1、创建一个名为 rbd-demo 的专门用于 RBD 的存储池 2、将存储池转换为 RBD 模式 3、初始化存储池 4、创建镜像 5、在管理节点创建并授权一个用户可访问指定的 RBD 存储池 6、修改RBD镜像特性,CentOS7默认情况下只支持layering和stripin

    2024年01月18日
    浏览(75)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包