QPS提升近10倍!解读飞桨加持下的文心一言满月成绩单

这篇具有很好参考价值的文章主要介绍了QPS提升近10倍!解读飞桨加持下的文心一言满月成绩单。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

近期,一直犹抱琵琶半遮面的国内各路AI相关厂商,扎堆发布大模型。一时间,百“模”大战,鱼龙混杂。

此前,作为全球第一个正式发布大模型的大厂,百度文心一言的一举一动,成为业界关注的焦点。

就在4月19日,时隔文心一言发布1个月又3天,一张“百度飞桨对文心一言定制优化例会会议纪要”的截图,被曝光出来,吸睛无数。

QPS提升近10倍!解读飞桨加持下的文心一言满月成绩单

三个数据,表现抢眼

从这份会议纪要,可以看到,百度飞桨在文心一言开启邀测后,一个月内迭代4次,目前已迭代至3.5版本,在业内首创支持动态插入的分布式推理引擎,单机QPS(每秒查询率)相对线上版本提升123%。飞桨与文心一言联合优化的效果,具体到数据表现上,有三个:

1. 模型推理效率提升10倍:相对于第一版大模型推理服务,单机QPS累计提升近10倍,这意味着大模型推理的成本降低为原来1/10,换句话说,可以并发为原来10倍数量的用户提供服务;

2. 模型推理性能提升50%:性能的提升意味着模型效果的提升,这也印证了文心一言进化更快了,学习又快又好了;

3. 模型算力利用率提升1倍:表明飞桨框架一方面与大模型的训练和部署进行协同优化,同时,框架向下承接芯片,相当于芯片的“指令集”,适配优化后得以激发芯片的潜力,模型算力的利用率才能够有所提升。

所有这些,是文心一言与飞桨深度学习框架协作的结果。而透过这些数据表现,我们还能发现两个更深层次的内涵,也许那就是各家的大模型最终要拼刺刀的地方。

全栈布局,自主安全

技术指标好坏,在一定程度上会反映出背后技术顶层设计策略的重要性。在人工智能时代,IT技术栈发生了根本性变革,从三层架构转变为“芯片-框架-模型-应用”四层架构。与此同时,大模型作为公认的人工智能时代的核心资产,如何保障其安全性,成为重中之重。做好四层架构的自主、自研,成为一条可行的路径。

在全球范围内,在四层架构的每一层都有领先产品的公司几乎没有。拥有了四层全栈布局,就可以把大模型可持续发展的主动权完全掌握在自己手里,也就意味着筑起了一道技术的护城河。

百度从高端芯片昆仑芯,到飞桨深度学习框架,再到文心一言,到搜索、智能云、自动驾驶、小度等应用,每一层都有布局,而且还拥有丰富的终端应用场景。全栈布局,全端覆盖,为大模型的学习、生长、安全可持续,提供了充足的养分和土壤。

QPS提升近10倍!解读飞桨加持下的文心一言满月成绩单

模框一体,天作之合

借用发动机,打个比方。如果大模型是发动机的话,框架则是发动机制造者,可以让发动机整体各个部件的组合更精密、动力更强,还可以自主迭代演进。反之,如果没有框架做训练、推理,协同优化,大模型就像是无法自主演进的发动机,动力不一定强。

AI框架之于大模型的重要性,在业内亦早有迹象。原美团联合创始人王慧文创立的大模型公司光年之外与 AI框架创业公司一流科技 Oneflow达成并购意向,就意在补齐框架层面的短板。

业界同时拥有大模型和框架的,屈指可数,大多数厂商或者框架用的是Tensorflow、PyTorch,或者没有自己的大模型。而据说谷歌、Meta等深度学习框架并没有基于大模型进行设计,导致当出现大模型需求时无法直接应用 TensorFlow 和 PyTorch,而是要在其基础上开发插件。

像百度这样,文心一言、飞桨深度学习框架,系出同门,协同配合,相得益彰。

一方面,文心一言的快速迭代,对框架层和芯片层,甚至应用层的发展是一种刺激和反哺。

另一方面,除了前面提到的发动机的比方,飞桨作为百度2016年推出的开源分布式架构,就是为应对并行GPU训练而生。大规模分布式训练历来是飞桨非常有特色的一个功能,实现了千亿稀疏特征、万亿参数、数百节点并行训练技术。比如,支持包括模型并行、流水线并行在内的广泛并行模式和加速策略,推出业内首个通用异构参数服务器架构、4D混合并行策略和端到端自适应分布式训练技术,这都引领了大规模分布式训练技术的发展趋势。

百度在深度学习框架上的提前布局,眼光独到,为大模型发展先人一步提供了保障。

面向未来,可以遇见的是千“模”、万“模”们还会继续、快速涌现,而谁是笑到最后的“模王”,且看全栈布局、自主安全、模型框架协同等能力。文章来源地址https://www.toymoban.com/news/detail-426892.html

到了这里,关于QPS提升近10倍!解读飞桨加持下的文心一言满月成绩单的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 百度CTO王海峰:全栈AI技术加持,打造新一代大语言模型文心一言

    3月16日,百度在北京总部召开新闻发布会,百度创始人、董事长兼首席执行官李彦宏和百度首席技术官王海峰出席,李彦宏展示了新一代知识增强大语言模型文心一言在文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成五个使用场景中的综合能力,王海峰解读

    2024年02月09日
    浏览(66)
  • 自动弹性,QPS线性提升|一文读懂云原生数仓AnalyticDB弹性技术原理

    在全球经济增长放缓的大背景之下,企业在加强数字化建设的过程中,实现效益最大化成为一个绕不开的话题。阿里云瑶池旗下的 云原生数仓AnalyticDB MySQL湖仓版 (以下简称AnalyticDB MySQL)在发布之初提供了定时弹性功能,帮助业务有规律的客户定时升降配计算资源以节省成

    2024年02月19日
    浏览(43)
  • 飞桨+文心一言的“动力装置”,藏着百度财报的增长密码

    我们习以为常的科技世界,正在以肉眼可见的速度被大模型所改变甚至重构。不想错失机遇的科技企业,都怀揣着造AI重器的梦想,各种大模型纷至沓来。 发布大模型只是开始,如同火箭发射,升空是第一步,后续能否顺利冲向太空、进入产业轨道,是一条充满了不确定的路

    2024年02月11日
    浏览(40)
  • 10W QPS 的会员系统,如何设计?

    来源:同程艺龙 会员系统是一种基础系统,跟公司所有业务线的下单主流程密切相关。如果会员系统出故障,会导致用户无法下单,影响范围是全公司所有业务线。所以,会员系统必须保证高性能、高可用,提供稳定、高效的基础服务。 随着同程和艺龙两家公司的合并,越

    2024年02月07日
    浏览(31)
  • 【文心一言】使用飞桨 AI Studio 快速搭建,看图识猜成语应用

    在大模型时代,人人都能成为大模型开发者! 飞桨星河社区是百度飞桨和文心大模型的生态社区,为开发者和生态合作伙伴提供算力、模型、数据、工具链、社区交流等全方位服务。开发者可以通过星河社区提供的开发工具集ERNIE Bot SDK,调用领先的文心4.0大模型能力,高效

    2024年02月05日
    浏览(50)
  • WAVE SUMMIT 定档8月16日,或将曝百度飞桨、文心大模型最新进展

    🤵‍♂️ 个人主页:@艾派森的个人主页 ✍🏻作者简介:Python学习者 🐋 希望大家多多支持,我们一起进步!😄 如果文章对你有帮助的话, 欢迎评论 💬点赞👍🏻 收藏 📂加关注+         2023年全球AI浪潮迭起,大语言模型热度空前,生成式人工智能为千行百业 高质量

    2024年02月14日
    浏览(39)
  • WAVE SUMMIT2023六大分会场同步开启,飞桨+文心大模型加速区域产业智能化!

    由深度学习技术及应用国家工程研究中心主办、百度飞桨和文心大模型承办的WAVE SUMMIT深度学习开发者大会2023将于8月16日重磅来袭!届时上海、广州、深圳、成都、南昌和宁波六大分会场将同步开启! 分会汇聚区域产业大咖、科研机构专家、知名学者和技术大牛,通过主题演

    2024年02月12日
    浏览(46)
  • 国内首个AI绘本价值十万!百度飞桨文心一格助力创作者探索AIGC商业价值

    近日,百家号在六周年之际面向全网创作者推出的“奇妙未来季”主题创作大赛收官。百度创作者“艺术家甲板”4岁女儿基于百度AI作画平台文心一格创作的AI绘本《外星超能战队》获得了AIGC创作赛道第二名的成绩,并被山东人民出版社看中,认为该绘本价值10万以上,或将

    2024年02月13日
    浏览(34)
  • 性能的极致,Rust的加持,Zed-Dev编辑器快速搭建Python3.10开发环境

    快就一个字,甚至比以快著称于世的Sublime 4编辑器都快,这就是Zed.dev编辑器。其底层由 Rust 编写,比基于Electron技术微软开源的编辑器VSCode快一倍有余,性能上无出其右,同时支持多人编辑代码。 Zed.dev编辑器还在灰度测试阶段,暂时只释出了Mac版本,在Zed.dev官网下载,安装

    2024年01月20日
    浏览(57)
  • Win 10 版NVIDIA GeForce GTX 1060显卡驱动的下载及飞桨(Paddle)的安装

    2、在打开的NVIDIA窗口中,我们点击:驱动程序; 3、下面打开的是NVIDIA驱动程序下载的页面(NVIDIA系列显卡),在这里我们要进行产品类型、产品系列、产品、操作系统和语言、下载类型的选择。 4、第一步我们选择的是产品类型,以 GTX 1060为例来说明操作步骤,如 NVIDIA Ge

    2024年02月06日
    浏览(37)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包