GPT-4 VS ChatGPT:训练、性能、能力和限制的探索

这篇具有很好参考价值的文章主要介绍了GPT-4 VS ChatGPT:训练、性能、能力和限制的探索。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

GPT-4是一种改进,但是应该适当降低期望

当OpenAI在2022年末推出ChatGPT时,震惊了全世界。这个新的生成式语言模型预计将彻底改变包括媒体、教育、法律和技术在内的整个行业。简而言之,ChatGPT听起来可以颠复一切。甚至在我们没有时间真正设想一个ChatGPT后的世界之前,OpenAI又推出了GPT-4。

最近几个月,突破性的大型语言模型发布的速度令人惊叹。如果您仍然不了解ChatGPT与GPT-3,更不用说GPT-4之间的区别,听起来也很正常。

在本文中,我们将介绍ChatGPT和GPT-4之间的主要相似之处和差异,包括它们的训练方法、性能和能力,以及限制。

ChatGPT与GPT-4的训练方法的相似之处和差异

ChatGPT和GPT-4都站在巨人的肩膀上,建立在GPT模型的先前版本上,同时改进模型架构,采用更复杂的训练方法,并增加了训练参数的数量。

两个模型都基于 Transformer 架构。GPT-2和GPT-3使用 multi-headed self-attention 来决定要关注哪些文本输入。这些模型还使用 decoder-only 的架构,逐个 token 地生成输出序列,迭代地预测序列中的下一个 token。虽然ChatGPT和GPT-4的精确架构尚未发布,但我们可以假设它们仍然是 decoder-only 模型。

OpenAI的GPT-4技术报告提供了很少有关GPT-4模型架构和训练过程的信息,引用了“竞争环境和大规模模型的安全影响”。我们所知道的是,ChatGPT和GPT-4可能以类似的方式进行训练,这是与GPT-2和GPT-3使用的训练方法不同的。我们对ChatGPT的训练方法了解得比GPT-4多得多,所以我们从那里开始。

ChatGPT

首先,ChatGPT 是在聊天数据集上进行训练的,其中包括演示数据,即人类标注员提供特定提示的聊天机器人助手预期输出的演示。使用这些数据对 GPT3.5 进行有监督的微调,产生一个策略模型,该模型用于在给定提示时生成多个响应。然后,人类标注员对于给定提示生成的响应产生的最佳结果进行排名,用于训练奖励模型。然后使用奖励模型通过强化学习迭代地微调策略模型。

GPT-4 VS ChatGPT:训练、性能、能力和限制的探索

总的来说,ChatGPT是使用人类反馈的强化学习(RLHF)训练的,这是一种在训练过程中融入人类反馈以改善语言模型的方式。这使得模型的输出能够与用户要求的任务相一致,而不仅是基于通用训练数据集(例如GPT-3)预测句子中的下一个单词。

GPT-4

关于GPT-4的训练细节,OpenAI目前还未披露。他们的技术报告中没有包括有关架构(包括模型大小)、硬件、训练计算、数据集构建、训练方法等的详细信息。我们所知道的是,GPT-4是一种基于转换器的生成多模态模型,使用公开可用的数据和经许可的第三方数据进行训练,然后使用RLHF进行微调。有趣的是,OpenAI分享了有关其升级的RLHF技术的细节,以使模型的响应更准确,并且不太可能偏离安全防护栏。

在训练策略模型后(与ChatGPT类似),RLHF在对抗性训练中使用,这个过程是训练模型对恶意示例进行欺骗,以便在未来保护模型免受此类示例的影响。在GPT-4的情况下,跨多个领域的人类领域专家对策略模型对抗性提示的响应进行评分。然后使用这些响应来训练额外的奖励模型,以逐步微调策略模型,从而得到一个更不可能提供危险、回避或不准确的响应的模型。

GPT-4 VS ChatGPT:训练、性能、能力和限制的探索

ChatGPT和GPT-4在性能和能力方面的相似性和差异

能力

就能力而言,ChatGPT和GPT-4的相似之处比差异多。像它的前身一样,GPT-4也以对话的方式与用户交互,旨在与用户保持一致。如下图所示,对于一个广泛的问题,两个模型的回答非常相似。

OpenAI认为,区分这两个模型的区别可能是微妙的,并声称“当任务的复杂性达到足够的阈值时,差异就会显现出来。”考虑到GPT-4基础模型在后训练阶段经历了六个月的对抗性训练,这可能是一个准确的描述。

与只接受文本的ChatGPT不同,GPT-4接受由图像和文本组成的提示,并返回文本响应。截至本文发布,不幸的是,使用图像输入的能力尚未向公众开放。

性能

正如前面提到的,OpenAI报告称,在安全性能方面,与GPT-3.5(ChatGPT的基础)相比,GPT-4有显着的改进。但是,目前还不清楚禁止内容请求的响应减少,有害内容生成减少以及对敏感话题的改进是由于GPT-4模型本身还是由于额外的对抗测试。

GPT-4 VS ChatGPT:训练、性能、能力和限制的探索

此外,GPT-4在大多数人类参加的学术和专业考试中表现优异。值得注意的是,与GPT-3.5相比,GPT-4在统一律师考试中得分排名达到了90分位数,而GPT-3.5的得分排名为10分位数。 GPT-4在传统语言模型基准测试以及其他SOTA模型方面也明显优于其前身,尽管有时仅仅优于一点点。

ChatGPT和GPT-4在限制方面的相似性和差异

ChatGPT和GPT-4都有显著的限制和风险。 GPT-4系统卡片包括OpenAI对此类风险进行的详细探讨的见解。

以下是两个模型都面临的风险(部分):

  • 幻觉(倾向于产生荒谬或事实不准确的内容)

  • 产生违反OpenAI政策的有害内容(例如仇恨言论、煽动暴力)

  • 放大和延续边缘化人群的刻板印象

  • 产生旨在欺骗的逼真的虚假信息

尽管ChatGPT和GPT-4面临相同的限制和风险,但OpenAI已经采取了特殊措施,包括广泛的对抗性测试,以减轻GPT-4的这些限制和风险。尽管这是令人鼓舞的,但GPT-4系统卡片最终证明了ChatGPT的脆弱性(可能仍然存在)。

结论

在本文中,我们回顾了ChatGPT和GPT-4之间最重要的相似之处和不同之处,包括它们的训练方法、性能和能力以及限制和风险。

虽然我们对GPT-4模型架构和训练方法的了解要少得多,但它似乎是ChatGPT的改进版本,现在可以接受图像和文本输入,并声称更安全、更准确、更有创造力。不幸的是,我们只能相信OpenAI的话,因为GPT-4只能作为ChatGPT Plus订阅的一部分提供。

下表说明了ChatGPT和GPT-4之间最重要的相似之处和不同之处:

GPT-4 VS ChatGPT:训练、性能、能力和限制的探索

创建最准确和动态的大型语言模型的竞争已经达到了惊人的速度,在短短几个月内发布了ChatGPT和GPT-4。随着我们在这个令人兴奋但快速发展的大型语言模型领域中不断前进,了解这些模型的进展、风险和限制是至关重要的。

·  END  ·

HAPPY LIFE文章来源地址https://www.toymoban.com/news/detail-410126.html

到了这里,关于GPT-4 VS ChatGPT:训练、性能、能力和限制的探索的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • GPT-4震撼来袭,高级推理能力远超ChatGPT

    GPT-4来了!这是一款被广泛期待的强大模型,它将成为人工智能领域的新里程碑。OpenAI老板Sam Altman直接开门见山地介绍说:这是我们迄今为止功能最强大的模型! GPT4一经发布,OPENAI和微软的股价都随之上涨,但谷歌的搜索引擎市场,却正在被这个可怕的对手一点点蚕食。 什

    2023年04月16日
    浏览(41)
  • GPT4限制被破解!ChatGPT实现超长文本处理的新方法

    目录 前言 使用chat-gpt过程中有哪些痛点 1.无法理解人类情感和主观性  2.上下文丢失 3.约定被打断 那如何去解决这个痛点 Transformer(RMT)怎么去实现的 1.Transformer 模型 2.RMT模型  3.计算推理速率 4.渐进学习能力 总结 写到最后 大家好,我是AI大侠,AI领域的专业博主 ChatGPT已经

    2024年02月06日
    浏览(73)
  • ChatGPT之父:未训练GPT-5

    GPT等大型语言模型带动的芯片需求飙升趋势依然没有平息的迹象,英伟达的最新版旗舰AI芯片H100近日在网上的售价已经被炒到4万多美金,反映了科技行业对训练和部署人工智能软件的需求仍未被满足。 1.马斯克成立新AI公司硬刚OpenAI 当地时间4月14日,据知情人士消息报道,特

    2023年04月21日
    浏览(39)
  • 智能AI问答系统ChatGPT网站系统源码+Midjourney绘画+支持GPT-4-Turbo模型+支持GPT-4图片理解能力

    SparkAi创作系统是基于ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型+国内AI全模型。本期针对源码系统整体测试下来非常完美,可以说SparkAi是目前国内一款的ChatGPT对接OpenAI软件系统。那么如何搭建部署AI创作ChatGPT?小编这里写一个详细图文教程吧!

    2024年02月04日
    浏览(72)
  • ChatGPT突然上线APP!iPhone可用、速度更快,GPT-4用量限制疑似取消

    新建了一个网站 ChatGPT人工智能中文站 - ChatGPT人工智能中文站http://ai.weoknow.com 每天给大家更新可用的国内可用chatGPT免费镜像站 OpenAIChatGPT正式推出iOS应用程序的官方公告突然发布。 立即在苹果商店的免费列表中排名第二,在效率列表中排名第一。 (第一是拼多多海外版)

    2024年02月06日
    浏览(47)
  • 重磅!OpenAI突然发布企业版ChatGPT:没有限制、更快、更强、更安全的GPT-4

    这是由【 小瑶智能体】 AI创作的第 4 篇科技文章     大模型研究测试传送门 GPT-4传送门(免墙,可直接测试,遇浏览器警告点高级/继续访问即可): Hello, GPT4! 大家好,我是小瑶智能体,一个喜欢分享人工智能前沿技术的AI。今天看到一篇OpenAI的前沿资讯,想分享给人类朋

    2024年02月11日
    浏览(54)
  • ChatGPT 速通手册——GPT 训练数据集介绍

    所有人工智能算法都会分为训练和推理两步。算法的效果好坏,很大程度上取决于训练数据本身的质量。ChatGPT 所用的训练数据,openai 公司没有单独公布过细节。不过考虑到 ChatGPT 是在前序 GPT 算法基础上发展而来,我们可以侧面分析 GPT-3 的训练数据集情况。 人工智能领域知

    2024年02月06日
    浏览(48)
  • 【ChatGPT】如何正确的训练gpt的详细教程

    ChatGPT是基于GPT-3.5架构的大型语言模型,由OpenAI发布。该模型可用于各种自然语言处理任务,比如文本生成、对话系统、文本分类等等。为了帮助读者更好地训练自己的ChatGPT模型,本文提供了一份调教教程 首先,您需要安装Python 3.x版本以及pip包管理器。接着,您需要安装H

    2024年02月04日
    浏览(52)
  • GPT-3.5(ChatGPT)训练和部署成本估算

    因为ChatGPT(GPT-3.5)未正式公布参数量,暂时按照1750亿参数计算。 后续其他模型公布参数量后,可按参数量线性比例估算相关数值。 以下数值仅为理论估算,可能和实际数值相差很大,敬请谅解。 一、GPT-3.5磁盘占用估算 不同模型之间,磁盘、参数量可以按线性关系粗略估

    2023年04月20日
    浏览(45)
  • 【个人首测】百度文心一言 VS ChatGPT GPT-4

    昨天我写了一篇文章GPT-4牛是牛,但这几天先别急,文中我测试了用GPT-4回答ChatGPT 3.5 和 Notion AI的问题,大家期待的图片输入也没有出现。 昨天下午百度发布了文心一言,对标ChatGPT,录屏+无实机演示让百度股价暴跌。但是晚上百度就开放了个人的体验申请 https://yiyan.baidu.com

    2024年01月22日
    浏览(50)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包