芯片工程师的ChatGPT初体验(上)

这篇具有很好参考价值的文章主要介绍了芯片工程师的ChatGPT初体验(上)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

2022年11月30日一定是一个载入人类AI发展史的一天,这一天第一个版本的Chat GPT(全称:Chat Generative Pre-trained Transforme)发布了。毫不夸张地说,chatGPT的发布和用户体验,将整个AI话题推上了一个前作未有的高度(包括最早的深蓝,AlphaGo,Boston Dynamics 等产品)。这是利用大语言模型(LLM:Large Language Model)完成人类和计算机的类人的模糊交流。包括比尔-盖茨,老黄等众多科技大佬为之点赞,整个科技界都为之狂欢,甚至都逼的Google大佬亲自上阵调教自家Bert来应对ChatGPT的挑战

ChatGPT 飓风

从ChatGPT发布到第一个一亿用户,只用了短短两个月,这个绝对是前无古人,后鲜有来者的数据。
芯片工程师的ChatGPT初体验(上)
互联网指数级的增长在这里得到了充分的体现,只要产品过影,火星人马丁叔叔都可能会成为你的忠粉
芯片工程师的ChatGPT初体验(上)
就在本月,连续三个有关AI的产品发布依次降临:

  • 2023年3月15日 OpenAI 发布ChatGPT4
  • 2023年3月16日 微软发布基于ChatGPT4引擎的Office 365 Copilot
  • 2023年3月16日  百度才发布“文心一言”
    前两个发布应该都是安排好的,微软是OpenAI的大股东,在ChatGPT3.5发布的时候就有过传言,微软正在全面整合ChatGPT到微软的产品中,第一个整合ChatGPT的微软产品就是新必应(New Bing,2023年2月7号发布),在过去的一个来月,Google的搜索量应声下降了2%!所以整合ChatGPT4的office Copilot就显得水到渠成了。有兴趣的小伙伴可以看一下Office 365 Copilot的发布会,相当震撼。office的体验简直丝滑到没有摩擦力了,半分钟word,10秒PPT,估计以后小朋友都可以直接玩转office了。此外,OpenAI的所有硬件都是运行在微软的Azure云服务器矩阵上的,OpenAI只生成创新,并不买服务器。但是大家要知道,最早的OpenAI可是选择Google的云服务器的。以上种种,可以看到微软这个48岁的老江湖,依然走在真个科技的最前沿,依然意气风发。
    第三个发布的百度的文心一言,这里确实要点赞一下!对于世界AI的崛起,中国绝对不能默不作声。虽然当前的文心一言还有很多不足的地方(有up主做过一些测试,有兴趣的小伙伴可以关注一下),但是这不是主要问题,先站出来迎战,才有可能形成挑战!

ChatGPT4的提升

ChatGPT4 相较于前版本GPT3.5有了更为强大的提升:

可以读取文字和图片混合模式的输入:可以读图生成网站的前端JS代码,或者理解一幅图的内容

芯片工程师的ChatGPT初体验(上)
提问:请问图片中有什么不寻常的地方
回答:这个图片有点奇怪,一个男的固定在一辆正在行驶中的出租车的车顶,并且在一个熨烫板上熨衣服。

通用考试中,更高的考试成绩

比如,在统一律师考试( Uniform Bar Exam )中,GPT-4 可以超过 90% 的人类考生,而老版本只能超过 10% 的人类考生,相当于一个是考第一名,一个是考倒数第一名。
在 GRE 数学考试中 GPT-4 可以考 163 分( 170 分满 )超过 80% 的考生,老版本只能超过 25% 的考生。
在 GRE 语文( 阅读与填空 )考试中 GPT-4 可以考 169 分( 170 分满 )超过 99% 的考生,而老版本只能超过 63% 的考生。
单从这两门的分数来看,GPT-4 到了可以申请哈佛、麻省理工、斯坦福大学的水平。

芯片工程师的ChatGPT初体验(上)

芯片工程师的ChatGPT初体验(上)

更大的训练模型

汽车已经发动起来了,速度提升只是时间问题,下图展示了ChatGPT4和ChatGPT3训练参数数量的区别
芯片工程师的ChatGPT初体验(上)

ChatGPT的原理

这么厉害的东东,他是怎么工作的呢?这里一起来看看它的工作原理
首先ChatGPT是一个单字生成迭代器。利用每一个输入的文字(注意是字不是词也不是句子),产生下一个字,中间产生的的过程也会有迭代。可以看到GPT的迭代是单向的,Google都Bert是双向的,这个其实会比较复杂,也会有算力的代价。笔者理解,人类的思维应该是更偏向于ChatGPT的单向迭代,当然如果Bert可以成功,那就会说出超语言(super-word)。
芯片工程师的ChatGPT初体验(上)
如果需要模型生成单字,就要训练他,就像对小朋友训练类似,不断地训练,小朋友可以表述的字和句子就会越来越丰富。这个还是沿用了传统的教育,引导,奖惩的机制。计算机的算法模型也是可以契合这种训练方式的,这个在上世纪80年代的AI训练中就有提及,这一点一直都没有发生变化,模型训练的简单步骤

  • 第一阶段:训练监督策略模型:对模型提供问题和正确答案的模板,供AI学习
  • 第二阶段:训练奖励模型:让AI尝试回答人类问题,人类对问题的答案进行打分,给出AI指引,这一过程类似于教练或老师辅导。引导AI在未来回答得分较高的答案
  • 第三阶段:使用离线模式强化训练:利用PPO(Proximal Policy Optimization)生成回答,并用第二阶段奖励模型进行打分,再次对AI进行打分迭代,从而强化PPO的模型参数和精准度
    不断重复第二和第三阶段,通过迭代,这样会训练出更高质量的ChatGPT模型。

ChatGPT算力和成本

硬件预览

ChatGPT 可以实现和人类对话的前提是有一个及其庞大的硬件运算体系,据估算,ChatGPT的总算力消耗约为3640PF-days (即假如每秒计算一千万亿次,需要计算3640天)。微软使用了一万片NV的A100 超高性能GPU芯片,单颗显卡售价唱过5万人民币,如果是基于A100的小型服务器,售价更是高达100万人民币!微软单在Azure的·A100的运算架构,就给OpenAI投入了上亿美元的云端设备。微软已经在评估NV最新的H100,算力提升明显,NV给出的评估是相较于A100,H100的算力会提高10倍,相信不久的未来ChatGPT的输出就出自H100的运算结果。当然,H100的售价更是超过了惊人的20万人民币(3+万US$,图示为日元报价).

芯片工程师的ChatGPT初体验(上)
据估算,OpenAI需要的初始硬件成本高达:10亿美金,约合65亿人民币

运算和运营成本

GPT-3训练成本约为140万美元;对于一些更大的LLM模型,训练成本约达到1120万美元。单日应对13M访客的电费就超过4.7万美金,基于数据的增长,每三到四个月就需要运算一次。一年下来,投入在训练和日常运营的成本就高达:2260万美金, 折合人民币约1.5亿。这个对于一般公司确实是一个不小的开支

参考资料

架构师技术联盟 ChatGPT发展历程、原理、技术架构详解和产业未来
国盛计算机 ChatGPT需要多少算力
Hassan Mujtaba *** NVIDIA H100 80 GB PCIe Accelerator With Hopper GPU Is Priced Over $30,000 US In Japan***
OpenAI *** GPT-4 Technical Report ***文章来源地址https://www.toymoban.com/news/detail-435811.html

到了这里,关于芯片工程师的ChatGPT初体验(上)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 那些30多岁的测试工程师都是怎么走过来的?

    最近工作真的不好找了,感觉身边的朋友明显变得焦虑了,一个个都在抱怨生活的迷茫和疑惑。 如今我们往往能够看到网上的各种新闻,什么“30岁是程序员的一道坎“ “非诚勿扰:32岁 程序员登台,遭美女全体灭灯!“,“华为辞退34岁以上老员工”,“40岁的程序员找不到工

    2024年02月06日
    浏览(46)
  • 软件测试工程师简历这样写,HR直接年薪30W叫你入职

    简历基本要素及模板 在IT行业如果你是一个工作多年的大牛并且在BAT等这样的一线互联网知名企业工作,那基本上不需要制作简历和提交简历。猎头公司会主动去找,会有很多机会让你选择。但是对于从业不久或者刚转行的小白来说,他既不是名校,甚至也不是计算机相关专

    2024年02月05日
    浏览(50)
  • 一个后端工程师对前端云 Vercel 的体验和探索

    今天小猿姐特邀咱们资深的程序猿为大家带来产品的体验报告。 Vercel 是一个为前端开发者设计的一体化平台(前端云),可以帮助开发者快速地将网站和应用程序部署到各种环境中,并且提供了一个灵活、可扩展和安全的平台,非常适合开发者在不同平台和环境中进行开发

    2024年04月17日
    浏览(32)
  • 嵌入式软件开发工程师应该关注芯片数据手册中的哪些信息

    1. 芯片的架构和处理器类型:了解芯片的架构和处理器类型可以帮助开发人员选择合适的开发工具和编程语言。 2. 芯片的时钟频率和电源要求:了解芯片的时钟频率和电源要求可以帮助开发人员设计合适的电路和电源系统。 3. 芯片的存储器类型和容量:了解芯片的存储器类

    2024年02月08日
    浏览(52)
  • 硬件工程师成长之路(11)——职业规划

    系列文章目录 1.元件基础 2.电路设计 3.PCB设计 4.元件焊接 5.板子调试 6.程序设计 7.算法学习 8.编写exe 9.检测标准 10.项目举例 11.职业规划 送给大学毕业后找不到奋斗方向的你(每周不定时更新) 【牛客网】构建从学习到职业的良性生态圈 中国计算机技术职业资格网 上海市工

    2024年02月17日
    浏览(53)
  • 浅谈ChatGPT取代前端开发工程师

    1.ChatGPT 是什么? ChatGPT 是一种基于深度学习的自然语言处理技术,它可以生成高质量的自然语言文本。该技术是由 OpenAI 团队 开发,旨在使计算机能够像人类一样理解和产生自然语言。ChatGPT 使用了深度神经网络和自然语言处理技术,通 过对大量语言数据的学习和建模,实现

    2023年04月08日
    浏览(38)
  • 吴恩达|chatgpt 提示词工程师学习笔记。

    目录 一、提示指南 写提示词的2大原则: 模型的限制 二、迭代 三、总结 四、推断 五、转换 六、扩展 七、对话机器人 吴恩达和openai团队共同开发了一款免费的课程,课程是教大家如何更有效地使用prompt来调用chatgpt,整个课程时长1个半小时,也提供了对应的环境和代码,大

    2024年02月08日
    浏览(50)
  • Devin内测注册全攻略:一文带你快速体验最新AI软件工程师技术 ️

    博主猫头虎的技术世界 🌟 欢迎来到猫头虎的博客 — 探索技术的无限可能! 专栏链接 : 🔗 精选专栏 : 《面试题大全》 — 面试准备的宝典! 《IDEA开发秘籍》 — 提升你的IDEA技能! 《100天精通鸿蒙》 — 从Web/安卓到鸿蒙大师! 《100天精通Golang(基础入门篇)》 — 踏入

    2024年03月16日
    浏览(111)
  • 开发工程师常用的ChatGPT通用提示词模板

    编程语言掌握:如何熟练掌握至少一门编程语言,如Java、Python、C++等? 开发工具使用:如何熟练使用常用的开发工具,如IDE、版本控制工具、调试工具等? 数据库操作:如何进行数据库设计和操作,包括数据模型设计、SQL语句编写等? 系统架构理解:如何理解系统架构,包

    2024年02月01日
    浏览(37)
  • 微软工程师带你解密大模型 ChatGPT

    ChatGPT 是如何做到打破 聊天机器人 “人工智障”的刻板印象?在众多实测体验中,它已具备轻松通过图灵测试的能力(即让人误以为是与真人对话),且其回答的详实程度、说服力与连续逻辑推理能力远超当前主流会话机器人。 传统认知里,我们觉得难以被替代的创意、研究

    2024年02月07日
    浏览(39)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包