POLARDB IMCI 白皮书 云原生HTAP 数据库系统 一 主体架构与接口

这篇具有很好参考价值的文章主要介绍了POLARDB IMCI 白皮书 云原生HTAP 数据库系统 一 主体架构与接口。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

POLARDB IMCI 白皮书  云原生HTAP 数据库系统  一  主体架构与接口

开头还是介绍一下群,如果感兴趣polardb ,mongodb ,mysql ,postgresql ,redis 等有问题,有需求都可以加群群内有各大数据库行业大咖,CTO,可以解决你的问题。加群请联系 liuaustin3 ,在新加的朋友会分到2群(共880人左右 1 + 2 + 3)新人会进入3群

POLARDB IMCI 白皮书  云原生HTAP 数据库系统  一  主体架构与接口

POLARDB IMCI 白皮书  云原生HTAP 数据库系统  一  主体架构与接口

3 概述
在本节中,我们首先概述PolarDB-IMCI的体系结构,接着总结驱动前面设计目标的设计理念,并简要描述用户界面。
3.1 PolarDB-IMCI的体系结构
图2显示了PolarDB-IMCI的体系结构,遵循将计算和存储架构分离的关键设计原则。存储层是一个具有高可用性和可靠性的用户空间分布式文件系统PolarFS [8]。计算层包含多个计算节点,包括用于读写请求的主节点(RW节点)、用于只读请求的多个节点(RO节点)以及多个无状态代理节点用于负载均衡。有了这些,PolarDB-IMCI可以提供高资源弹性性(§7)。此外,存储和计算层中的所有节点都通过高速RDMA网络连接以实现数据访问的低延迟。
为加快分析查询速度,PolarDB-IMCI支持在RO节点的行存储上建立内存列索引(§4)。列索引按插入顺序存储数据,并执行位于原位置之外的写操作以实现高效更新。插入顺序意味着列索引中的行可以通过其行ID(RID)而不是主键(PK)快速定位。为支持基于PK的点查找,PolarDB-IMCI实现了一个RID定位器(即两层LSM树)用于PK-RID映射。
PolarDB-IMCI使用一个异步复制框架(§5)进行RO和RW之间的同步。即,RO节点的更新不包含在RW的事务提交路径中,以避免对RW节点的影响。为增强RO节点上的数据新鲜度,PolarDB-IMCI在日志应用方面使用了两个优化,预提交式日志传送和无冲突并行日志重播算法。RO节点通过行存储的REDO日志进行同步,这比其他稻草人方法(例如使用Binlog)对OLTP造成的干扰要小很多。需要注意的是,将物理日志应用到列索引中并不是微不足道的,因为行存储和列索引的数据格式是异构的。
每个RO节点中都使用两个相互共生的执行引擎(§6):PolarDB的常规基于行的执行引擎来处理OLTP查询,以及一个新的基于列的批处理模式执行引擎用于高效运行分析查询。批处理模式执行引擎借鉴了列式数据库处理分析查询的技术,包括管道执行模型、并行运算符和矢量化表达式评估框架。常规基于行的执行引擎通过增强优化可进行列引擎不兼容或点查询。PolarDB-IMCI的优化器自动为两个执行引擎生成和协调计划,此过程对使用者透明。
3.2 设计理念
我们以下面突出PolarDB-IMCI的设计理念,这也适用于其他云本地HTAP数据库。
存储计算分离。同时作为云本地数据库的关键设计原则,存储计算分离架构在没有数据移动的情况下实现了适应性计算资源配置,这已经成为主流架构的替代方案。PolarDB-IMCI采取此决策以自然地达成我们的设计目标G#5(高资源弹性)。
单个RW节点和多个RO节点。实践中,单写架构已经通过[52] 确认拥有卓越的写性能并显着降低系统复杂性。我们观察到单个RW节点足以为95%的客户提供服务。此外,所有RO节点都具有与RW节点同步的一致数据视图。大型OLAP查询被路由到RO节点上以实现有效的资源隔离,RO节点可以快速扩展以处理激增的OLAP查询,这符合设计目标G#3(对OLTP的最小干扰)和G#5(资源弹性)。
RO节点内的混合执行和存储引擎。从OLAP社区的经验中得出,列式数据布局和矢量化的批处理执行对于OLAP查询来说是显著的优化。然而,对我们而言,直接使用现有的列式系统(例如ClickHouse)作为RO节点是不明智的决定。有两个原因支持这个论点。首先,在创建表方面,实现RW节点和RO节点之间的全兼容是耗时的。在云服务环境中,即使存在微小的不兼容性,也会在巨大的客户量下被显著放大并压垮开发人员。其次,纯基于列的RO节点对于被归类为OLTP工作量的点查找查询仍然效率低下。因此,我们开始设计一个扩展PolarDB原始执行引擎的新基于列的执行引擎,以满足目标G#1(透明度)。列式执行引擎的设计旨在满足G#2(先进的OLAP性能)。而基于行的执行引擎处理不兼容和点查询,前者无法处理。RO节点具有基于行和基于列的执行和存储引擎。
双格式RO节点通过物理REDO日志进行同步。在共享存储架构上,新RO节点可以快速启动以处理激增的只读查询,以满足设计目标G#5,并可以保持数据新鲜度(即G#4)通过不断应用RW节点的REDO日志。然而,将异构存储与原始物理日志(即REDO日志)同步是具有挑战性的,因为日志与底层数据结构(例如页面)密切相关。因此,稻草人方法是使RW节点记录用于列存储的附加逻辑日志(例如Binlog)。缺点是,当提交事务时触发额外的fsyncs,从而对OLTP造成非常大的性能干扰。因此,我们专门设计了一种新的同步方法,通过重用REDO并使RO节点上的逻辑操作由物理日志组成。之所以可行是因为PolarDB-IMCI在RO节点上维护基于行的缓冲池和列索引。逻辑操作可以通过在行缓冲池上的应用进程中获得。我们的评估显示,重用REDO日志的开销明显低于使用Binlog。

3.3 用户界面
PolarDB-IMCI中的列存储作为一种新的索引类型公开,即列索引。应用程序可以根据需要为表创建列索引。由于PolarDB-IMCI完全兼容MySQL,因此应用程序可以使用带有MySQL语法的SQL语句来创建列索引。示例如图3所示。它创建了一个具有五个列的表,主键索引在列C1上创建,次要索引在列C2上创建,并在列C3、C4和C5上创建了列索引。
此外,在创建表时指定包含在列索引中的列时,应用程序还可以使用ALTER状态将列索引添加到后来。当应用程序在具有大量行的表上执行数据定义语言(DDL)来添加列索引时,RO节点将在PolarDB-IMCI的行存储上发出一致性读取,扫描检查点,并在并行转换为列索引。请注意,向PolarDB-IMCI添加列索引是一项在线操作:在DDL操作进行时,表上的查询和DML操作可以同时处理。并发DML操作所做的更改将记录在缓冲区中,并在过程结束时应用于新的列索引。

POLARDB IMCI 白皮书  云原生HTAP 数据库系统  一  主体架构与接口文章来源地址https://www.toymoban.com/news/detail-514976.html

到了这里,关于POLARDB IMCI 白皮书 云原生HTAP 数据库系统 一 主体架构与接口的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【阿里云·云原生架构·白皮书】保姆级解读 一、 云原生架构定义

    🔎这里是【阿里云·云原生架构·白皮书】,关注我学习云原生不迷路 👍如果对你有帮助,给博主一个免费的点赞以示鼓励 欢迎各位🔎点赞👍评论收藏⭐️ 【阿里云·云原生架构·白皮书】 主要更新一些在学习云原生架构时的一些总结,以及对白皮书内容的解读。 主要介

    2024年02月09日
    浏览(36)
  • 全景描绘云原生技术图谱,首个《云原生应用引擎技术发展白皮书》发布

    5月1 2 日,由 神州数码主办、北京经开区国家信创园 、 中关村云计算产业联盟协办 的2 023 通明湖论坛-云原生分论坛在京召开 。论坛期间,神州数码联合北京通明湖信息技术应用创新中心、中国信通院和通明智云正式发布了《云原生应用引擎技术发展白皮书》(以下简称:

    2024年02月05日
    浏览(62)
  • 《金融数据保护治理白皮书》发布(137页)

    温馨提示:文末附完整PDF下载链接 导读   目前业界已出台数据保护方面的治理模型,但围绕金融数据保护治理的实践指导等尚不成熟,本课题围绕数据保护治理的金融实践、发展现状,探索和标准化相关能力要求,归纳总结相关建设范式,推进数据保护、治理在金融领域的

    2024年02月14日
    浏览(47)
  • 【中国金融机构 FRTB 合规的数据挑战 白皮书】

    来源: 毕马威,彭博 本报告将重点聚焦中国银行业在实施 FRTB 过程中面临的主要数据挑战,并探讨可行的解决方案,旨在帮助机构了解 FRTB 新规实施的要点与难点,充分评估现状与差距,寻找到适合自身特点的 FRTB 实施路径。本报告由来自全球领先的金融数据提供商彭博(

    2024年02月03日
    浏览(47)
  • 中国信通院&腾讯安全发布《2023数据安全治理与实践白皮书》

    导读 nbsp; 腾讯科技(深圳)有限公司和中国信息通信研究院云计算与大数据研究所共同编制了本报告。本报告提出了覆盖组织保障、管理流程、技术体系的以风险为核心的数据安全治理体系,并选取了云场景、互娱、社交等场景,介绍相应场景下数据安全治理实践路线及主要亮

    2024年02月14日
    浏览(44)
  • 中国信通院联合腾讯安全发布《数据安全治理与实践白皮书》

    6月26日,由中国通信标准化协会和中国信息通信研究院联合主办的“2023大数据产业发展大会”在北京启幕,大会发布了多项中国信息通信研究院及相关机构在数智化领域最新研究和实践成果。 腾讯云安全总经理李滨出席了数据安全高质量发展论坛,分享了腾讯云自身数据安

    2024年02月12日
    浏览(38)
  • 曙光数创、曙光信息共同编写《绿色节能液冷数据中心》白皮书

    近日,《绿色节能液冷数据中心白皮书(2023)》(简称白皮书),经过近10位指导编委、20余位编委、历时近半年时间编制,正式通过专家评审会议。白皮书旨在为建立标准化液冷解决方案提供技术参考,促进产业链互通协作。 白皮书由国家互联网数据中心产业技术创新战略

    2023年04月20日
    浏览(40)
  • 【大数据&AI人工智能】企业级大数据产品体系技术架构白皮书

    目录 以 One Data 为内核,“快”、“准”、“全”、“统”、“通”的智能大数据体系  DataWorks 产品架构

    2023年04月08日
    浏览(87)
  • EIDchain汇金公链白皮书一种基于区块链技术的身份隐私和数据隐私保

    目   录   表 引   言   3 一 、       背景   4 二、       区块链隐 私泄露风险高   5 三、          加密交易和 范围证明   6 1.       加密交易 6 2.       范围证明 7 四、       区块链隐私和安全   8 1.       区块链隐私和安全 8 2.        余额隐藏机制

    2024年02月08日
    浏览(52)
  • Solana白皮书中文翻译(1)

    作者:Anatoly Yakovenko(anatoly@solana.io) 翻译:tangenter.eth 本文提出了一种新的区块链架构,其基础是一种能够验证链上事件发生的先后顺序及时间间隔的新共识算法,称作 工作历史证明 (Proof of History,PoH)。PoH算法能够将不可信任的时间间隔数据打包为区块链账本——一种只

    2024年02月02日
    浏览(67)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包