重磅!微软开源Deep Speed Chat,人人拥有ChatGPT!

这篇具有很好参考价值的文章主要介绍了重磅!微软开源Deep Speed Chat,人人拥有ChatGPT!。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

4月12日,微软宣布开源了Deep Speed Chat,帮助用户轻松训练类ChatGPT等大语言模型,使得人人都能拥有自己的ChatGPT!(开源地址:https://github.com/microsoft/DeepSpeed) 

据悉,Deep Speed Chat是基于微软Deep Speed深度学习优化库开发而成,具备训练、强化推理等功能,还使用了RLHF(人工反馈机制的强化学习)技术,可将训练速度提升15倍以上,成本却大幅度降低。例如,一个130亿参数的类ChatGPT模型,只需1.25小时就能完成训练。

简单来说,用户通过Deep Speed Chat提供的“傻瓜式”操作,能以最短的时间、最高效的成本训练类ChatGPT大语言模型,这标志着一个人手一个ChatGPT的时代要来了。

重磅!微软开源Deep Speed Chat,人人拥有ChatGPT!

,时长03:12

产品演示

微软为什么开源Deep Speed Chat

ChatGPT只用了几个月的时间便席卷全球,成为史上用户增长速度最快的消费级应用,对世界的经济发展、科技研发起到了重要的推动作用。很多企业、个人用户纷纷想参与到这场AI技术变革中,但由于庞大的资源、资金投入只能望而却步。

即便开源领域推出了LLaMa、Alpaca、Vicuna、Databricks-Dolly等优秀的类ChatGPT项目,仍缺乏一个支持端到端的基于RLHF的规模化系统,使得训练强大的类ChatGPT模型非常艰难

重磅!微软开源Deep Speed Chat,人人拥有ChatGPT!

例如,使用上述开源项目训练一个67亿参数的类ChatGPT模型,通常需要昂贵的多卡至多节点的GPU集群,但这些资源对大多数科学家、小型企业、个人开发者而言难以获取。

即便是拥有这样的资源,现有的开源系统的训练效率通常还不到,这些机器所能达到的最大效率的5%

重磅!微软开源Deep Speed Chat,人人拥有ChatGPT!

现在,通过Deep Speed Chat解决资源、算法等难题,轻松、高效的训练数千亿参数的最先进的类ChatGPT模型。

Deep Speed Chat技术简单介绍

ChatGPT模型的训练是基于InstructGPT论文中的RLHF方式,这使得现有深度学习系统在训练类ChatGPT模型时存在种种局限。现在,通过Deep Speed Chat可以突破这些训练瓶颈,达到最佳效果。

Deep Speed Chat拥有强化推理、RLHF模块、RLHF系统三大核心功能。

简化 ChatGPT 类型模型的训练和强化推理:只需一个脚本即可实现多个训练步骤,包括使用Huggingface 预训练的模型、使用 DeepSpeed-RLHF 系统运行 InstructGPT 训练的所有三个步骤,生成属于自己的类ChatGPT模型。此外,还提供了一个易于使用的推理API,用于在模型训练后测试对话性能。

重磅!微软开源Deep Speed Chat,人人拥有ChatGPT!

Deep Speed-RLHF 模块:DeepSpeed-RLHF 复刻了InstructGPT 论文中的训练模式,并确保包括:a) 监督微调(SFT),b) 奖励模型微调和 c) 基于人类反馈的强化学习(RLHF)在内的三个步骤与其对应。此外,还提供了数据抽象和混合功能,以支持用户使用多个不同来源的数据源进行训练。

重磅!微软开源Deep Speed Chat,人人拥有ChatGPT!

DeepSpeed-RLHF系统:将DeepSpeed的训练和推理能力整合到统一的混合引擎(DeepSpeed Hybrid Engine or DeepSpeed-HE)中用于RLHF 训练。DeepSpeed-HE 能够在RLHF中无缝地在推理和训练模式之间切换,使其能够利用来自 DeepSpeed-Inference 的各种优化。

例如,张量并行计算和高性能CUDA算子进行语言生成,同时对训练部分还能从 ZeRO- 和 LoRA-based 内存优化策略中受益。DeepSpeed-HE可以自动在 RLHF 的不同阶段进行智能的内存管理和数据缓存。

此外,Deep Speed Chat在成本、效率、扩展性等方面非常优秀。

高效且节省成本:在Azure云上只需9小时即可训练一个OPT-13B模型,只需18小时即可训练一个 OPT-30B模型。这两种训练分别花费不到300美元和600 美元。

重磅!微软开源Deep Speed Chat,人人拥有ChatGPT!

卓越扩展性:能够支持训练拥有数千亿参数的模型,并在多节点多 GPU 系统上展现出卓越的扩展性。因此,即使是一个拥有 130 亿参数的模型,也只需 1.25 小时就能完成训练。而对于拥1750亿参数的模型,使用Deep Speed Chat进行训练也只需不到一天的时间。

注意:在Azure上训练时由于GPU不同,所以训练时间和费用也各不相同。

全民ChatGPT时代来了

做个不太恰当的比喻,微软此次开源Deep Speed Chat就像当年的互联网,为了提升发展速率降低了台式机的价格,使得普通用户也能拥有自己的电脑。

只有参与的用户多了,整个行业生态才能快速壮大发展,所以,微软此次开源对整个ChatGPT生态发展起到了至关重要的推动作用,使得人人都能拥有自己的ChatGPT。

目前,ChatGPT处于初级发展阶段,存在安全隐患、数据隐私、道德等问题。相信随着参与用户的增多,这些难题将会被有效的解决,从而为全球经济发展做出贡文章来源地址https://www.toymoban.com/news/detail-430720.html

到了这里,关于重磅!微软开源Deep Speed Chat,人人拥有ChatGPT!的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 微软重磅开源 Visual ChatGPT! 一个月内斩获30K star

    点击上方“Github中文社区”,关注 大家好,我是Huber。 今年由于大环境恶化,为了生活本人这一年在某外企从事某个秘密项目(正经的那种)的研发,所以没有时间(动力)和精力(钱)更新推文,最近项目已经交付完成,这里向大家说声对不起,很开心再一次和大家相见(

    2023年04月22日
    浏览(23)
  • 全面开放!微软 Bing Chat 人人可用,还要做搜索引擎的「App Store」

    没有一点点防备,新 Bing 就悄悄地突然向所有人开放了。 或许微软是想要给每个耐心等待的用户一点回报,伴随着此次开放,微软还给 Bing 安排了一次大更新,现在你不仅可以用 Bing Chat 搜索、聊天,还能用它生图、读网页、甚至帮你订餐馆。 不得不说,微软确实是把搜索引

    2024年02月04日
    浏览(22)
  • 微软重磅更新:Bing Chat全线改名Copilot,用户可免费使用GPT4!(文末附Copilot使用教程)

    原创 | 文 BFT机器人  微软在2023年的Ignite大会上宣布了许多新产品和功能。其中最引人注目的是Bing Chat更名为Copilot,Copilot基于最新的OpenAI模型,包括GPT-4和DALL・E 3,为用户提供文本和图像生成功能。也就是说,只要你拥有微软账户,就能够免费使用GPT-4、DALL·E 3、GPTs等功能!

    2024年02月05日
    浏览(21)
  • 人人可拥有刘强东同款数字人分身!

    每个人都可以拥有东哥同款数字人分身直播间进行直播带货, 怎样克隆自己的数字人形象? 青否数字人克隆源码的克隆效果媲美真人: 仅需将真人录制的2-6分钟视频上传至克隆端后台,系统便会自动启动自动克隆。3-5小时后,即可生成一个与本人在形象、表情及动作上1:

    2024年04月22日
    浏览(11)
  • 云服务器部署开源ChatGLM-6B,让你也能拥有自己的ChatGPT

    一、背景 最近GPT不仅发布了GPT-4,而且解除封印可以联网了。不得不赞叹AI更新迭代的速度真快,都跟不上节奏了。但是大家也注意到了吧,随着GPT的每次更新,OpenAI对其开放使用的限制也越来越大。之前国内网随便访问GPT3,现在动不动就封号 所以,今天就来教大家部署国内

    2024年02月12日
    浏览(25)
  • 开源一键拥有你自己的ChatGPT+Midjourney网页服务,用不用是另一回事,先收藏!

    原 ChatGPT-Next-Web 所有功能 midjourney imgine 想象 midjourney upscale 放大 midjourney variation 变幻 midjourney describe 识图 midjourney blend 混图 midjourney 垫图 绘图进度百分比、实时图像显示 自身支持midjourney-api MIDJOURNEY_PROXY_URL ⚠️注意:如果你使用的是Docker部署,那么这里的地址应该是 http:

    2024年02月12日
    浏览(25)
  • 【开源免费】ChatGPT-Java版SDK重磅更新至1.0.10版,支持Tokens计算,快来一键接入!!!

    ChatGPT Java版SDK开源地址:github.com/Grt1228/cha… ,目前收获将近1000个star。 有bug欢迎朋友们指出,互相学习,所有咨询全部免费。 最新版:1.0.10 整合web示例,支持流式返回: 开发思路可以参考:github.com/Grt1228/cha… 流式输出实现方式 小程序 安卓 ios H5 SSE参考:OpenAISSEEventSour

    2024年02月04日
    浏览(23)
  • 三分钟拥有自己的 chat-gpt (开发到上线)

    首先你需要有一个 laf 账号,如果你还不知道 laf 是什么,点击这里三分钟学会 然后你还需要有一个 chat-gpt 的账号并且生成一个 apiKey (这一步可以问 Google ) 具备了上面这两个条件我们就可以开始啦。 点击 NPM 依赖右边的加号 搜索 chatgpt 找到对应的 npm 包 保存并重启应用。 然

    2023年04月25日
    浏览(26)
  • 【大数据 AI】视觉ChatGPT来了,微软发布,代码已开源

      GitHub - microsoft/visual-chatgpt: VisualChatGPT Visual ChatGPT 将 ChatGPT 和一系列可视化基础模型连接起来,以支持在聊天过程中发送和接收图像。 近年来,大型语言模型(LLM)取得了令人难以置信的进展,尤其是去年 11 月 30 日,OpenAI 重磅推出的聊天对话模型 ChatGPT,短短三个月席卷社

    2024年02月03日
    浏览(21)
  • 微软等开源评估ChatGPT、Phi、Llma等,统一测试平台

    微软亚洲研究院、中国科学院自动化研究所、中国科学技术大学和卡内基梅隆大学联合开源了,用于评估、分析大语言模型的统一测试平台——PromptBench。 Prompt Bench支持目前主流的开源、闭源大语言模型,例如,ChatGPT、GPT-4、Phi、Llma1/2、Gemini、Baichuan、Yi 等。 PromptBench内置了

    2024年01月21日
    浏览(14)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包