GPT-3.5(ChatGPT)训练和部署成本估算

这篇具有很好参考价值的文章主要介绍了GPT-3.5(ChatGPT)训练和部署成本估算。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

因为ChatGPT(GPT-3.5)未正式公布参数量,暂时按照1750亿参数计算。
后续其他模型公布参数量后,可按参数量线性比例估算相关数值。

以下数值仅为理论估算,可能和实际数值相差很大,敬请谅解。

一、GPT-3.5磁盘占用估算

不同模型之间,磁盘、参数量可以按线性关系粗略估算;
yolov5x:参数量87.6M,磁盘占用166M
175B/87.6M = 1751024/87.6 = 2046
GPT-3.5磁盘占用估算:166
2046/1024 = 332G
所以GPT-3.5模型大小约为332G。GPT-3.5参数量是YOLOV5X参数量的2046倍。

二、GPT-3.5用于推理时显存占用估算

显存占用估算方法参考:https://blog.csdn.net/weixin_49305813/article/details/119179849
显存占用=模型显存(参数)+batch_size×每个样本显存(输出和梯度动量)
GPT-3显存占用:17510244 /1024 = 700G (参数为32float,占4个字节)
需要A100数量:700G/80G = 9块A100
所以,GPT-3.5仅做推理时,空转显存占用约700G,需要大约9块A100(80G)显卡。

考虑用户访问模型:
国信证券测算称,训练阶段每个Token的训练成本约为6N(推理成本为2N)。
根据Similarweb的数据,23年1月份当前ChatGPT日活约1300万人,每人平均1000字左右的问题,因此合计产生约130亿字(173.3亿个token)。假设24小时平均分配任务,需要的算力为
173.3亿21750亿/(51%24小时3600秒)=173000000002175000000000/24/3600/0.51/1000000000000000
=137 PetaFLOP/S
由于访问流量存在峰值,假定访问峰值是一天均值的5倍, NVIDIA 80GB A100 GPU理论算力是 0.312 PFLOPS。
需要A100显卡数量 137*5/0.312 = 2195块
所以,大约需要2195块A100可以满足日活约1300万人访问需求。

三、GPT-3.5训练使用的显卡数量估计

据OpenAI团队发表于2020年的论文《Language Models are Few-Shot Learners》,训练一次1746亿参数的 GPT-3模型需要的算力约为3640 PF-days。
如果是 NVIDIA 80GB A100 GPU, 理论算力是 312 TFLOPS,Megatron 利用 tensor parallel 和 pipeline parallel 并行技术能达到 51.4% 的利用率,也即是每秒能完成 0.160 PFLOPS。
一张A100卡需要跑3640/0.16 = 22750(天)
按照1个月的训练时间计算,需要A100卡数量估计 = 22750/30 = 758 (块)
据悉,训练Meta AI的OPT-175B使用了992张80GB的A100 GPU,每个GPU的算力达到了147 TFLOP/s。
所以,综合以上信息估计完成一次训练,A100卡的用量需求大约为1000块。

四、租赁价格估计

显卡(NVIDIA 80GB A100 GPU)的租赁价格为 1.5 刀每小时
综合上面的访问和训练用A100数量:2195+1000=3195;
还需要考虑并行训练、测试等用卡量,总体按10000块A100估计。
10000块A100一天的租赁费用:10000 * 24 * 1.5 = 360000刀 = 36万刀
注:以上未考虑英伟达对OpenAI的优惠价格。

五、其他机构预测(感觉比较离谱)

3月7日消息,市场调查机构TrendForce公布的最新报告指出,如果以英伟达A100显卡的处理能力计算,运行ChatGPT将需要使用到30000块英伟达GPU。
调查机构TrendForce在报告中指出,预估ChatGPT需要20000块显卡来处理训练数据。随着OpenAI继续在商业上部署ChatGPT和该公司的生成式GPT模型,可能需要超过30000块显卡。
目前英伟达 A100 显卡的售价在10000-15000美元之间,该售价取决于OpenAI需要多少显卡,以及英伟达是否会为AI公司提供订单折扣。TrendForce预估英伟达可以赚取超过3亿美元(IT之家备注:当前约 20.82 亿元人民币)收入。
ChatGPT训练阶段总算力消耗约为3640 PF-days(即1PetaFLOP/s效率跑3640天)。据普超资本微信公众号,GPT-3训练成本预计在500万美元/次。

六、参考

GPT-3.5(ChatGPT)训练和部署成本估算

以GPT-3 175B为例,说明PF-days和flops的等量关系;
3.64E+03 PF-days=3640 * 1000 * 1000* 100010001000243600 = 3.14E+23 次浮点运算

NVIDIA 80GB A100 GPU 理论算力参考:
GPT-3.5(ChatGPT)训练和部署成本估算

Megatron 利用率 参考:
GitHub - NVIDIA/Megatron-LM: Ongoing research training transformer models at scale
GPT-3.5(ChatGPT)训练和部署成本估算

显卡租赁价格参考:
GPT-3.5(ChatGPT)训练和部署成本估算文章来源地址https://www.toymoban.com/news/detail-419073.html

到了这里,关于GPT-3.5(ChatGPT)训练和部署成本估算的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 使用GPT-4生成训练数据微调GPT-3.5 RAG管道

    OpenAI在2023年8月22日宣布,现在可以对GPT-3.5 Turbo进行微调了。也就是说,我们可以自定义自己的模型了。然后LlamaIndex就发布了0.8.7版本,集成了微调OpenAI gpt-3.5 turbo的功能 也就是说,我们现在可以使用GPT-4生成训练数据,然后用更便宜的API(gpt-3.5 turbo)来进行微调,从而获得

    2024年02月09日
    浏览(33)
  • 重磅!openAI开放chatGPT模型APIgpt-3.5-turbo,成本直降90%!

    ChatGPT API,千呼万唤终于来了。 chatGPT不仅开放 成本还直降90%! 全新API基于“gpt-3.5-turbo”模型,其基础是支持ChatGPT的GPT 3.5模型,取代了此前的“text-davinci-003.”。这款名为“gpt-3.5-turbo”的模型,定价为 0.002美元/每1000 tokens 。这“比我们现有的GPT-3.5模型便宜 10 倍”,部分原

    2023年04月09日
    浏览(31)
  • 【ChatGPT】GPT-3.5+ChatGPT:图解概述

      总结 常见问题 –ChatGPT的受欢迎程度 –ChatGPT的成本 –ChatGPT的成就 –在本地运行ChatGPT –API 时间线 GPT-3概述(2020年5月) GPT-3.5或InstructGPT概述(2022年1月) ChatGPT概述(2022年11月) ChatGPT的推荐替代方案 OpenAI ChatGPT与DeepMind Sparrow的比较 ChatGPT的成功 OpenAI(由埃隆·马斯克创

    2024年02月08日
    浏览(36)
  • OpenAI ChatGpt Gpt-3.5-turbo

    返回结果 首先安装 OpenAI、GPT Index 和 Gradio 库 复制以下代码,取名chatgptsample.py

    2024年02月03日
    浏览(36)
  • 【ChatGPT】参加计算机科学考试(GPT-4对比GPT-3.5)

    ChatGPT真的“无敌”了吗???? 我们邀请ChatGPT参加一项关于算法和数据结构的本科计算机科学考试。我们把它的答案手抄到一张考卷上,然后在盲测的情况下,随机选200名参与的学生。我们发现ChatGPT以20.5(满分40分)的成绩勉强通过了考试。这一令人印象深刻的表现表明,

    2023年04月11日
    浏览(40)
  • ChatGPT API 比 GPT-3.5 便宜 10 倍

      AI 社区今天发布了一条重大新闻。OpenAI终于宣布为其广受欢迎的对话式 AI ChatGPT发布API。     什么是聊天 GPT? ChatGPT 是 OpenAI 开发的大型语言模型(LLM)。它可以理解、处理和响应类人语言。它具有在几秒钟内写诗、撰写论文和撰写研究论文的能力。该人工智能非常受欢迎

    2023年04月12日
    浏览(44)
  • ChatGPT:基于GPT-3.5架构的强大语言模型

    这段时间,周围朋友们讨论最多的除了春招的激烈之外,就是ChatGPT了,大家被ChatGPT的智能和超强的学习能力所震惊,甚至担心未来会被人工智能所取代。 这样的担心不无道理,我们程序员作为技术人员,需要对新技术保持敏锐的嗅觉,以免被时代抛弃。但就我最近对ChatGP

    2024年02月07日
    浏览(37)
  • chatgpt新版gpt-3.5-turbo模型API教程

    形式:输入一个问题,模型会生成一个结果,一问一答形式 功能:创建一个聊天接口地址:POST https://api.openai.com/v1/chat/completions (Beta) 请求参数(Request body): model: string 必须 使用的模型,只有 gpt-3.5-turbo 和 gpt-3.5-turbo-0301 两个取值 messages:array 必须 需要传入的内容,里面

    2024年02月04日
    浏览(35)
  • [ChatGPT] 从 GPT-3.5 到 GPT-5 的进化之路 | ChatGPT和程序员 : 协作 or 取代

    ⭐作者介绍:大二本科网络工程专业在读,持续学习Java,努力输出优质文章 ⭐作者主页:@逐梦苍穹 ⭐如果觉得文章写的不错,欢迎点个关注一键三连😉有写的不好的地方也欢迎指正,一同进步😁 写在前面:ChatGPT官方:https://chat.openai.com/chat 任何限制次数的、功能较单一的

    2024年02月05日
    浏览(39)
  • 【ChatGPT】基于tensorflow2实现transformer(GPT-3.5)

    请记住,您是一位NLP领域的专家和优秀的算法工程师。使用带有 tensorflow2.0 subclass api 的 python 从头开始实现 transformer 模型。 全部内容如下: 构建transformer模型架构和依赖层; 生成并预处理一些假样本数据,用于训练上面构建的模型; 上面生成的样本数据的训练模型示例教程

    2023年04月10日
    浏览(27)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包