全域Serverless+AI,华为云加速大模型应用开发

这篇具有很好参考价值的文章主要介绍了全域Serverless+AI,华为云加速大模型应用开发。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

日前,华为全联接大会2023在上海召开。华为云CTO张宇昕在大会上发布了基于Serverless技术的大模型应用开发框架,框架以面向AI领域全新升级的FunctionGraph 3.0为核心,将BaaS for AI 后端和开放平台快速无缝集成,助力企业轻松商用AI应用。

在“全域Serverless + AI 加速应用创新”专题演讲上,华为云首席产品官方国伟、华为2012实验室中软分布式与并行软件实验室主任谭焜,分享了Serverless和AI如何结合的前沿理念和实践,深度解析华为云在Serverless领域核心产品及基于元戎架构构建的分布式内核能力,为开发者打造Serverless AI极优体验,帮助企业加速应用创新;广联达科技股份有限公司首席业务专家/副总裁祁长福分享了在建筑行业,华为云Serverless产品如何基于FunctionGraph优化AI应用开发,提升开发团队工作效率。

全域Serverless 为千行万业深度用云带来新体验

方国伟介绍,在AI时代背景下,软件开发的方式由以代码为中心,走向以模型为中心,如何将AI大模型能力充分利用起来,是当下云厂商积极探索的事情。

华为云首席产品官方国伟

企业研发人员在构建AIGC应用时更多关注开发部署门槛能否降低,更快的完成企业需求。运维人员要确保系统能够稳定运行,在业务量高峰时刻做到快速弹性,业务量小时节约成本,企业既能实现业务目标,又能保证系统可靠性高、成本较低。

为了更好的支撑AIGC应用,华为云提供了全域Serverless能力,推出了CCE Autopilot、FunctionGraph、CAE等Serverless产品,将一系列的AI原生技术构筑成后端服务,形成BaaS for AI能力,调用即可得。结合完善的工具链,帮忙企业快速构建应用。

Serverless 容器CCE Autopilot、CCI让用户无需关注底层资源,自动运维,帮助用户降低运维成本。

在Cloud Bursting场景,去哪儿网基于CCI打造了灵活上云新体验,完成业务0改造,实现4000实例/30s的极致弹性。

FunctionGraph 3.0八大关键能力,助力AIGC应用创新

全新升级的FunctionGraph 3.0,新增Serverless应用中心、独创Snapshot冷启动加速、预留实例智能推荐特性,配合异构资源虚拟化技术,实现AIGC应用低成本、低延迟,加上端到端的全链路压测和全栈可观测能力,助力AIGC应用快速开发,天级上线。

杭州曼孚科技有限公司是行业领先的AI基础架构与数据智能平台服务商,基于FunctionGraph构建自动化AI训练平台,更细粒度的GPU算力供给加上按需全自动资源弹性,实现成本降低40%。

华为云Serverless事件总线服务事件网格EventGrid能够支持统一事件中心、事件驱动引擎、开放与集成、降低开发成本四大典型场景,为企业提供中心化的事件集成、治理和驱动能力。

在车联网场景,某Top车企使用EventGrid构建Serverless化的事件驱动架构的同时,实现上下游异步解耦,便于扩展和避免单点故障;作为无码化对接的事件中心,避免云服务间点对点对接,减少50%开发工作量以及数据高可靠0丢失和数据规则调整0变更。降低成本。

Serverless应用托管CAE产品升级:支持应用0代码修改平迁上云,用户无需修改业务代码;支持Web/微服务应用Serverless化,帮助企业降本增效,提升业务稳定性。

香港新世界旗下广州新合创科技有限公司,使用CAE全托管模式提升50%效率;后续还会根据商场人流峰值设定定时伸缩,节省资源以降低成本。

BaaS for AI:华为云BaaS服务DWS 3.0 提供Pay By Resource弹性模式和Pay By Query弹性模式,帮助企业实现后端服务Serverless化。

“华为云提供全域Serverless能力,让开发者5倍速开发行业大模型,支撑千行万业的AI应用开发。面向AI领域全新升级的FunctionGraph 3.0,真正实现大模型应用即开即关、即时响应,无限扩展。”

Serverless 挺进 AI,强强联合加速AI应用创新

华为2012实验室中软分布式与并行软件实验室主任谭焜

基于自主创新元戎内核构建的FunctionGraph 3.0如何保障AI应用开发部署低成本和响应低时延,谭焜做了深入的技术分享:

模型开发部署依赖昂贵的异构资源。传统的异构函数,CPU和XPU资源绑定分配,单一推理函数包含CPU和XPU操作,操作CPU时XPU空闲,操作XPU时CPU空闲,资源利用率低。元戎独创的纯XPU异构函数,CPU和XPU资源绑定解耦,用户可把不同类型资源的操作写成不同的函数,执行时分解到不同算力处理器上,无闲置资源。

FunctionGraph打造Serverless AI最佳平台

在大模型推理场景,包括全量推理和增量推理两个阶段。全量推理阶段算力需求远高于增量推理阶段,增量推理阶段,耗时可能远长于全量推理阶段。针对这类场景,元戎可以做到全量推理和增量推理解耦,各自按需弹性扩缩,精确算力供给,真正按使用量计费,降低用户成本。

更快的应用响应速度意味着更好的用户体验。元戎自主创新的FoldFormer AI模型可在线持续预测用户业务负载,提前进行实例预热,达到85%~95%准确率,大大降低了冷启动概率。无法被准确预测的流量,通过一系列优化措施加速冷启动。在用户模型下载阶段,基于内置的内存数据系统和SSD构建的分级高速缓存,实现系统内缓存模型文件,大幅缩短下载时间。计算时,模型按Layer分批加载,并根据用户SLA和模型推理时延历史数据构建最优pipeline, 降低参数加载和模型推理总时延,冷启动优化到秒级。

谭焜最后总结道:“基于元戎内核,FunctionGraph 3.0提供异构函数极速冷启动,细粒度异构资源管理和按需弹性扩缩,打造Serverless AI极低成本和极致性能;依托华为云丰富的BaaS服务和全托管的开发环境,打造Serverless AI极优体验。”

AI赋能建筑行业数字化

广联达科技股份有限公司首席业务专家/副总裁祁长福发表AI赋能建筑行业数字化主题演讲。“广联达作为数字建筑平台服务商,立足建筑产业,围绕工程项目的全生命周期,为客户提供数字化解决方案,公司提出“数字建筑”理念,希望通过“数字建筑”系统、全面、深度地助力建筑产业转型升级。”

广联达科技股份有限公司首席业务专家/副总裁祁长福

祁长福介绍,在技术方面,广联达通过大力研发BIM 和云计算、大数据、物联网、移动互联网、人工智能等信息技术引领产业转型升级。

在AI领域,广联达围绕行业难点,围绕设计、成本、施工等重点领域,打造核心AI应用。应用设计采用Serverless理念,依托华为云Serverless服务构建解决方案,将AI模型以镜像方式部署在FunctionGraph,对外提供通用API,无需管理运维异构资源(GPU等),模型实例随业务量全自动扩缩容,无请求时实例缩容到0,低成本高可用运行。上层应用采用FaaS+ BaaS的Serverless应用架构,集成模型推理接口,只需专注于业务逻辑代码,可函数级粒度并行开发,快速迭代应用。

华为云FunctionGraph技术极大的优化了AI应用的开发过程,让AI团队可以更关注业务实现,而无需关注底层技术细节。

“广联达以推动建筑行业数字化为己任,着力打造‘数字+连接+算法’的系统性数字化。围绕行业痛点,我们以智能化技术为基础,依托华为云FunctionGraph Severless架构,打造建筑从业人员的CoPilot,帮助行业人员提升作业效率,提高管理水平和决策质量。”

未来,华为云将持续落地全域Serverless产品,与华为2012实验室深度合作,以FunctionGraph3.0为核心,打造Serverless AI极低成本和极致性能,充分满足大模型应用的敏捷要求,助力千行万业深度用云。

点击关注,第一时间了解华为云新鲜技术~文章来源地址https://www.toymoban.com/news/detail-711620.html

到了这里,关于全域Serverless+AI,华为云加速大模型应用开发的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 如何快速开发、部署 Serverless 应用?

    本文将详细介绍如何开发和部署 Serverless 应用,并通过阿里云函数计算控制台与开发者工具 Serverless Devs 进行应用的初始化、部署;最后分享应用的调试,通过科学发布、可观测性等介绍应用的部署和运维总结,进而实现从应用初始化到调试、发布、运维基础流程、核心步骤

    2024年02月04日
    浏览(32)
  • AI 大模型应用开发实战纲要

    初探大模型:起源与发展 预热篇:解码注意力机制(Attention ) 变革里程碑:Transformer 的崛起 走向不同:GPT 与 Bert 的选择 GPT 模型家族:从始至今 GPT 模型家族:从始至今 从 GPT-1 到 GPT-3.5:一路的⻛云变幻 ChatGPT:赢在哪里 GPT-4:一个新的开始 大模型的未来:开源力量

    2024年02月07日
    浏览(30)
  • 实战指南 | Serverless 架构下的应用开发

    UC Berkeley认为Serverless架构的出现过程类似于40多年前从汇编语言转向高级语言的过程,在未来Serverless架构的使用会飙升,或许服务器式云计算并不会消失,但是将促进BaaS发展,以更好地为Serverless架构提供支持。 Serverless 架构的应用开发流程 基于 Serverless 架构的应用开发流程

    2024年02月12日
    浏览(27)
  • 大模型时代,如何快速开发AI应用

    本文分享自华为云社区 《【云享问答】第3期:大模型时代,如何快速开发AI应用》,作者:华为云社区精选。 大模型快速普及应用的当下,AI浪潮汹涌而至,对于开发者来说,开发一款属于自己的AI应用并不是遥不可及。华为云AI生态技术专家、中科院计算所博士坐阵,从数

    2024年02月08日
    浏览(25)
  • 应用 Serverless 化,让业务开发心无旁骛

    我们希望让用户做得更少而收获更多,通过Serverless化,用云就像用电一样简单。”张建锋表示,Serverless 让云计算从一种资源真正变成一种能力,未来云将全面 Serverless 化,更加接近“电网”模式,按计算的调用次数付费。 11 月 3 日,2022 杭州 · 云栖大会上,阿里云智能总裁

    2024年01月21日
    浏览(25)
  • AI大模型开发架构设计(10)——AI大模型架构体系与典型应用场景

    1 AI大模型架构体系你了解多少? GPT 助手训练流程 横向来看,分为四步:预训练(无监督、99%算力+时间)、有监督微调、奖励模型、强化学习 纵向来看,每一部分需要:数据集(Dataset)、算法(Algorithm)、模型(Model)、花销 GPT 助手训练数据预处理 2个训练案例分析 2 AI 大

    2024年02月20日
    浏览(43)
  • AI大模型开发架构设计(2)——AI绘画技术架构&应用实践

    1 AI绘画整体流程 第一步:输入 Prompt 提示词: /mj 提示词 第二步:文生图(Text-to-Image)构图 第三步:图片渲染 第四步:图片展示 2 AI绘画技术架构 文生图核心算法原理 把人类创造的内容用一个高维的数学向量进行表示 如果内容到向量的“翻译” 足够合理 且能 代表内容的特

    2024年01月25日
    浏览(33)
  • 【基础篇001】⼤模型理论基础——初探大模型:起源与发展《AI 大模型应用开发实战指南》

      目录 基础篇:⼤模型理论基础 初探大模型:起源与发展 什么是大模型?

    2024年02月09日
    浏览(39)
  • TiDB Serverless Branching:通过数据库分支简化应用开发流程

    2023 年 7 月 10 日,TiDB Serverless 正式商用。这是一个完全托管的数据库服务平台(DBaaS),提供灵活的集群配置和基于用量的付费模式。紧随其后,TiDB Serverless Branching 的测试版也发布了。 TiDB Serverless Branching 功能使用户能够为其 TiDB Serverless 集群创建分支。这些分支可以实现并

    2024年02月10日
    浏览(36)
  • 鸿蒙应用/元服务开发实战-Serverless云存储没法创建处理方式

    新账户,Serverless云存储没法创建 ,没法进行下一步。   解决方式 请按照这个方式修改一下就能正常创建了,浏览器中打开控制台输入 window.top.cfpConfig.cloudStorageSwitch=‘off’ 后再创建桶

    2024年02月21日
    浏览(28)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包