阿里云云边一体容器架构创新论文被云计算顶会 ACM SoCC 录用

这篇具有很好参考价值的文章主要介绍了阿里云云边一体容器架构创新论文被云计算顶会 ACM SoCC 录用。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

近日,由阿里云撰写的关于 KOLE 创新论文被 ACM SoCC 国际会议长文录用。

alibaba 边缘计算 论文,云计算,架构,阿里云,云原生,容器

ACM Symposium on Cloud Computing(以下简称 SoCC)是由美国计算机协会主办、聚焦云计算技术的一项学术会议,是云计算的首要会议。它汇集了对云计算感兴趣的研究人员、开发人员、用户和实践者,是唯一由 SIGMOD(数据管理特别兴趣组)和 SIGOPS(操作系统特别兴趣组)联合主办的会议, 这个会议在近些年蓬勃发展,旨在聚集数据库和计算机系统两大领域的学者,共同推进云计算技术在工业界的研究与发展。

此次被录用的论文为《KOLE: Breaking the Scalability Barrier for Managing Far Edge Nodes in Cloud》。此论文灵感诞生于阿里云边缘容器产品 ACK@Edge ,ACK@Edge 是阿里云容器服务针对边缘计算场景推出的云边一体化协同托管方案,采用非侵入方式增强,提供边缘自治、边缘单元、边缘流量管理、原生运维 API 支持等能力,以原生方式支持边缘计算场景下的应用统一生命周期管理和统一资源调度,现阶段已经覆盖了 CDN、音视频直播、物联网、物流、工业大脑、城市大脑、地产、票务、新零售、能源、交通等实际业务场景,并服务于阿里云 LinkEdge、盒马、优酷、视频云、大麦、CDN 等多个业务或项目中。

alibaba 边缘计算 论文,云计算,架构,阿里云,云原生,容器

KOLE 全称:A framework built on top of Kubernetes to Orchestrate Limitless (far) Edge nodes。KOLE 针对 Kubernetes 在云边一体,大规模边缘节点管理方面的挑战,创新性的提出了基于 Kubernetes的新的云边架构,通过利用新的云边通信协议以及缓存快照的方式,使 Kubernetes 能够轻松管理数百万节点。为了突破 Kubernetes 管理大量边缘节点的可扩展性限制,KOLE 的设计遵循三个标准:

  • 避免创建大量对象来持久化边缘节点的状态;
  • 避免在节点与 APIServer 中保持大量的 HTTP 连接;
  • 使用 Kubernetes CRD 支持对边缘节点及其运行的应用程序进行所需的管理操作。

基于以上原则,KOLE 创新性的使用了 MQTT 协议作为云边通信机制,MQTT 被设计用于轻量级的发布/订阅式消息传输,旨在为低带宽和不稳定的网络环境中的物联网设备提供可靠的网络服务,是专门针对物联网开发的轻量级传输协议,并且适合百万级设备连接, MQTT 协议针对低带宽网络,低计算能力的设 备,做了特殊的优化,MQTT 的传输格式非常精小,最小的数据包只有 2 个比特,相对于 HTTP 协议具有更低的能耗。

经过我们大量的实验测试评估,KOLE 可以支持多达 100 万个节点,而不会给 Kubernetes 的核心组件(如 Apiserver 和 etcd)带来显著的开销。我们能够使用 KOLE 在约 73 秒内将工作负载规范分发到 100 万个节点,在 5 分钟内处理 100 万个节点注册,并在约 20 秒内使用快照中的 100 万个节点重建云状态缓存。具体特点如下:

  • 更强的处理节点心跳的性能

alibaba 边缘计算 论文,云计算,架构,阿里云,云原生,容器

实验数据表明 KOLE 处理所有心跳的时间几乎随着节点数量的增加呈线性增加。处理一百万个注册心跳需要 ∼9.2 秒。

  • 更低的云端控制器组件的消耗

alibaba 边缘计算 论文,云计算,架构,阿里云,云原生,容器

对于 100 万个节点,KOLE 控制器和 MQTT Broker 的内存消耗分别为 10.6GB 和 57.3GB,CPU 使用率适中,KOLE 控制器消耗~1.4 个核心,MQTT Broker 消耗~2 个核心。

  • 更快的工作负载分发

alibaba 边缘计算 论文,云计算,架构,阿里云,云原生,容器

KOLE 通过 MQTT Topic 发送到单个节点时提供了线性可扩展性。将工作负载分别分发到一百万个节点需要 73 秒。线性来自 KOLE 控制器按顺序发布所有 MQTT Topic 的事实。

  • 更高效的云状态缓存快照

alibaba 边缘计算 论文,云计算,架构,阿里云,云原生,容器

由于 Kubernetes 对 CRD 的限制为 1MB 大小,因此 KOLE 将云状态缓存的序列化字节流设置为为 500MB,对于一百万个节点,这意味着需要 ∼500 个快照用于保存一张快照的 CR 实例。另外为了对数据进一步压缩,KOLE 对常见的压缩算法进行了测试,最终在 KOLE 中,我们选择 gzip 作为默认压缩算法,因为它提供了高压缩比和快速压缩时间,将快照 CR 的数量从 503 个减少到 33 个(减少 93%)。

alibaba 边缘计算 论文,云计算,架构,阿里云,云原生,容器

在极端情况下, 我们需要从快照中恢复最原始的数据,上图展示了从快照构建云状态缓存所需要时间,其中包括从 APIServer 加载所有快照 CR 的时间以及运行解压缩算法以恢复数据结构的时间。使用 gzip 算法构建具有 100 万个节点的缓存需要 ∼20 秒。为了突出 KOLE 中快速状态恢复的优势,我们通过列出来自 APIServer 的大量单个节点对象来检查 Kubernetes List API 的性能。结果如上图所示。正如预期的那样,从 APIServer 列出大量对象是低效的。列出一百万个节点对象需要 900 秒。很多 Kubernetes 控制器如 kube-scheduler,kube-controller-manager 需要在启动过程中列出所有节点, List API 性能是他们支持大量节点的瓶颈之一。

  • 更迅速的批量节点注册

alibaba 边缘计算 论文,云计算,架构,阿里云,云原生,容器

实验结果表明,在拥有 100 万个节点情况下,同时批量注册成功需要 260 秒左右。

此次论文入选 ACM SoCC,是阿里云在云原生容器技术领域,拓展服务边界,实现云边协同的又一次创新。

附论文信息

录用论文题目:

KOLE: Breaking the Scalability Barrier for Managing Far Edge Nodes in Cloud

作者:张杰,晋晨,黄玉奇,易立,叔同,郭飞

论文概述:在边缘计算领域,越来越多的趋势是利用容器化和 Kubernetes 等云原生技术和平台来管理边缘应用程序以提高运营效率。不幸的是,Kubernetes 中每个集群支持的节点数量只有几千个,这远远少于在典型边缘计算场景中所能管理的设备节点数量。在本文中,我们提出了 KOLE 方案,这是一个扩展上游 Kubernetes 以支持大量边缘节点的框架。它用 MQTT 消息系统代替了 Kubernetes 中现有的 Apiserver 与节点的通信机制。MQTT 代理完全卸载了为 Apiserver 中的节点保持大量 HTTP 连接的开销。在 KOLE 中,我们通过在云状态缓存中维护它们来避免在 Apiserver 中创建大量单独的对象。缓存会定期生成快照以进行灾难恢复。总体而言,KOLE 通过牺牲拥有单个对象的可管理性实现了出色的可扩展性。实验结果表明,KOLE 具有可扩展性,可支持百万级别的节点。

点击此处,了解边缘容器服务 ACK@Edge 更多详情!文章来源地址https://www.toymoban.com/news/detail-792276.html

到了这里,关于阿里云云边一体容器架构创新论文被云计算顶会 ACM SoCC 录用的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 北京阿里云代理商:阿里云云计算 书籍是啥

    简介: 飞机@luotuoemo 本文由(阿里云国际站代理商:【聚搜云】www.4526.cn )撰写 阿里云是阿里巴巴集团旗下的云计算服务提供商,拥有全球领先的云计算技术和服务能力。作为北京阿里云代理商,我们将重点介绍阿里云的优势和好用之处。 阿里云提供多种云计算服务,包括

    2024年02月21日
    浏览(53)
  • 【阿里云云计算工程师 ACP 认证】01、弹性计算 ECS

    目录 一、什么是 ECS 1.1 什么是弹性计算 ECS 1.2 弹性计算 ECS 的定位 1.2.1 弹性的伸缩能力 1.2.2 计算的基础运行环境 二、ECS 的基本概念 2.1 ECS 相关概念、地域与可用区 2.2 实例规格 2.2.1 在官网上创建之后会有各种各样的规格集,规格集的命名规则是怎样的? 2.2.2 上图有两大块

    2024年02月15日
    浏览(67)
  • 阿里云云计算负载均衡SLB和弹性伸缩AS

    SLB实现原理:①访问流量路径  采用集群部署,当前提供四层(TCP UDP)和七层(HTTP HTTPS)的负载均衡服务。系统由三部分构成:四层负载均衡,七层负载均衡控制系统;四层:LVS+Keepalived  七层:tengine;②控制系统:用于监控和配置整个负载均衡系统 Master+Agent:Master 接受用

    2024年02月01日
    浏览(51)
  • 跨行新手学习并备考阿里云云计算专业认证ACP大概需要多长时间呢?

    阿里云认证是基于核心技术及岗位的权威认证, 阿里云针对不同产品类别、用户成长阶段、生态岗位,精心打造不同的认证考试。 个人:证明您在对应技术领域的专业度,能够基于阿里云产品解决实际问题。获得更多阿里云生态下的就业机会。 公司:通过阿里云认证培养、

    2024年02月15日
    浏览(54)
  • 阿里云云服务器最新价格表(第六代计算型c6、通用型g6和内存型r6)

    目前阿里云第六代云服务器有计算型c6、通用型g6和内存型r6实例。计算型c6实例有2核4G、4核8G、8核16G配置可选,主要适用于网站应用、批量计算、视频编码等场景。通用型g6实例有2核8G、4核16G、8核32G配置可选,适用于各种类型的企业级应用,网站和游戏服务器等场景。内存型

    2024年02月03日
    浏览(52)
  • 从阿里云降价,看中国云计算创新之变

    继“疯狂星期四”历史级大降价后,阿里云“AI驱动、公共云优先”的战略布局再落一子。 近日,阿里云与菜鸟、高德地图、中远海运、东航物流、圆通速递、申通快递、中通快递、德邦快递、G7易流、地上铁、浙江大学智能交通研究所等共同发起成立“物流智能联盟”。据

    2024年03月20日
    浏览(51)
  • 阿里云云计算工程师ACA认证(Alibaba Cloud Certified Associate - Cloud Computing)考试大纲-V3.0

    阿里云云计算工程师ACA认证(Alibaba Cloud Certified Associate - Cloud Computing)介绍: 阿里云云计算工程师ACA认证(Alibaba Cloud Certified Associate - Cloud Computing)考试是面向云计算行业工作人员的初级认证,主要考核考生对云计算领域知识的整体掌控情况。 通过该技术认证可以有效证明

    2024年02月03日
    浏览(70)
  • 中国移动发布COCA软硬一体片上计算架构,引领云计算市场下一个黄金十年

    当前,数字经济发展已经成为改变全球竞争格局的关键力量,随着算力成为数字经济新引擎,算力规模持续增长,算力结构发生改变。主动拥抱智算浪潮,持续输出优质算力支撑数字中国建设,适配泛在化、异构化算力推动数智化转型,正成为面向未来基础设施新变革的重要

    2024年02月04日
    浏览(45)
  • 云计算:从基础架构原理到最佳实实之:云计算容器化与微服务架构

    作者:禅与计算机程序设计艺术 云计算(Cloud Computing)已经成为当今信息技术领域的热门话题,其带来的高性价比、弹性可扩展、按需付费等特性,正在成为各行各业互联网公司及个人的日常工作方式。本文将从云计算架构的基础原理出发,系统地介绍云计算中常用的容器技

    2024年02月06日
    浏览(41)
  • 阿里云云上博客报错

    安装mysql时: 输入:yum -y install httpd httpd-manual mod_ssl mod_perl mod_auth_mysql 显示:No match for argument: mod_auth_mysql Error: Unable to find a match: mod_auth_mysql 安装php时: 命令:yum -y install php php-mysql gd php-gd gd-devel php-xml php-common php-mbstring php-ldap php-pear php-xmlrpc php-imap 报错:No match for argument:

    2024年01月16日
    浏览(36)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包