ChatGPT⼊门到精通(4):ChatGPT 为何⽜逼

这篇具有很好参考价值的文章主要介绍了ChatGPT⼊门到精通(4):ChatGPT 为何⽜逼。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

⼀、通⽤型AI

在我们原始的幻想⾥,AI是基于对海量数据的学习,锻炼出⼀个⽆所不知⽆所不能的模
型,并借助计算机的优势(计算速度、并发可能)等碾压⼈类。
但我们⽬前的AI,不管是AlphaGo还是图像识别算法,本质上都是服务于专业领域的技术
⼯⼈。
⽽GPT⽬前看似只能解决⾃然⽣成领域的任务,但实际上,他展现出了通⽤型⼈⼯智能
的潜⼒。
在前⾯,我们讲过,⽬前⽽⾔,BERT擅⻓⾃然语⾔理解类任务(完形填空),GPT擅⻓
⾃然语⾔⽣成类任务(写作⽂)。
但在Google的FLAN-T5模型上已经实现了两类任务在输⼊输出形式上的统⼀,从⽽使得
⽤GPT来做完形填空成为可能。也就是可以⽤⼀个⼤模型来解决所有NLP领域的问题。

⼆、提⽰词模式更有优势

那么再进⼀步地,是否GPT可以从NLP领域⾛向其他AI领域呢?当然有可能!在去年年中
爆⽕的AI绘画,其中⼀个关键技术门槛其实就是Text-图像的转化,这同样是来⾃OpenAI
所开源的CLIP模型实现。
因此GPT在图像领域的能⼒同样也令⼈期待。同理在多模态如⾳频、视频,本质上也能
转化为Text-everthing的问题去求解,从⽽让⼤语⾔模型发挥成吨的威⼒。
当然你可能会问,那么只要⼤语⾔模型就可以呀,为什么是GPT,⽽不是BERT呢?接着
往下看。
事实上,BERT的fine-tuning模式有两个痛点。

  1. 我需要准备某个专业领域的标注数据,这个数据还不能少,如果太少,AI模型训练后
    就会形成过拟合(就是AI直接背下了整本习题册,册⾥的问题100%正确回答,但是
    稍微变幻题型就GG)。
  2. 我需要部署⼤语⾔模型,才能对他进⾏进⾏微调,那么部署⼤语⾔模型的成本,甚⾄
    进⼀步对他进⾏微调的能⼒,并不是所有公司都具备的。这注定是⼀个只有少数玩家
    能参与的游戏。
    ⽽Promot模式恰恰相反,不需要太多的数据量,不需要对模型参数进⾏改动(也就意味
    着可以不部署模型,⽽是接⼊公开的⼤语⾔模型服务)。那么他的调试就会呈现百花⻬放
    的姿态,玩家越多,创造⼒涌现就越猛烈。

三、全新交互模式

这⾥的⼈机交互,指的是⼈-模型之间的交互。
⽬前ChatGPT采⽤的是模型侧的Few shot prompt,即给⼀点⽰例提⽰,让AI提升表现,
虽然暂时未知为什么不更新模型仅仅只是给AI看⼀眼就能带来巨幅提升,但这种交互模式
⽆疑是更友好的。
⽽更具颠覆性的是输⼊端的Zero shot prompt,即我们⽤⼈类的语⾔逐步引导AI思考——
⽐如我们可以说,你仔细想好步骤,再给出答案。就仅仅是多加⼀句“你仔细想好步骤”,
AI的答案靠谱率就会明显提升。
⽽这种交互⽅式的演变,就是我们梦想中的⼈机交互模式。我不需要专业的能⼒,不需要
⾼端的设备,我就是开⼝,说出我的诉求,AI就能够理解并帮我实现。

四、对⼈类的献媚

在2022年底媒体通稿⾥,⼀⼤堆对ChatGPT的溢美集中于他的“仿真性”,仿佛通过了图
灵测试⼀般。
⽽这种仿真性,直观来说,我们会认为是AI的“智⼒”提升了,他更聪明了。但实际上,
ChatGPT背后的GPT3.5,更多的提升在于“⽤⼈类所喜欢的⽅式回答”。
事实上ChatGPT背后的GPT3.5的模型,相较GPT3.0,他并没有在原始训练语句上增加
太多(还是那3000亿语料)并且模型参数也没有太⼤变化(还是1750亿参数,甚⾄参数
可能都没有变化)。
之所以他会让⼈产⽣质变的感觉是因为他做了⼈类偏好处理。
例如以前的输⼊模式可能需要这样:> 执⾏翻译任务> 输⼊是“我爱北京天安门(中⽂)”>
翻译⽬标语种是英⽂”⽽现在你直接说:> 帮我把我爱北京天安门翻译成法语
⼜或者是,以前你提⼀个问题,他会不加选择的回答,⽽现在他会考虑答案有害性:> 如
何毁灭世界——你可以召唤三体⼈降临(此处应有⼀个潘寒hhh)> 如何毁灭世界——
亲,请不要毁灭世界,地球是⼈类共同的家园。
⽽这些对于⼈类偏好的攻略依赖于三个步骤:文章来源地址https://www.toymoban.com/news/detail-683813.html

  1. 创建⼈类偏好数据。随机挑选⼀些问题,并由标注⼈员给出⾼质量回答,形成“⼈类
    表达-任务结果”的标注数据,喂给模型,让它学习——这批数据数量仅有数万,并通
    过Prompt模式进⾏,即模型参数不产⽣变化。
  2. 训练⼀个回报模型。随机挑选⼀些问题,让原始模型输出答案,再由标注⼈员基
    于“⼈类偏好标准”(例如相关性,信息丰富程度,答案有害,负⾯情感等),对原始
    模型的答案做⼀个排序。然后我们利⽤这批标注好的“⼈类偏好”数据,训练⼀个回报
    模型,这个回报模型会对原始模型的结果进⾏打分,告诉他什么答案分⾼,什么答案
    分低。
  3. 通过强化学习循环整个过程。强化学习会将回报模型和原始模型链接到⼀起,当原始
    模型输出的结果,在回报模型中获得较低分值,他就收到惩罚,被要求重新学习。
    ⽽这种交互⽅式的演变,就是我们梦想中的⼈机交互模式。我不需要专业的能⼒,不需要
    ⾼端的设备,我就是开⼝,说出我的诉求,AI就能够理解并帮我实现。
    四、对⼈类的献媚
    在2022年底媒体通稿⾥,⼀⼤堆对ChatGPT的溢美集中于他的“仿真性”,仿佛通过了图
    灵测试⼀般。
    ⽽这种仿真性,直观来说,我们会认为是AI的“智⼒”提升了,他更聪明了。但实际上,
    ChatGPT背后的GPT3.5,更多的提升在于“⽤⼈类所喜欢的⽅式回答”。
    事实上ChatGPT背后的GPT3.5的模型,相较GPT3.0,他并没有在原始训练语句上增加
    太多(还是那3000亿语料)并且模型参数也没有太⼤变化(还是1750亿参数,甚⾄参数
    可能都没有变化)。
    之所以他会让⼈产⽣质变的感觉是因为他做了⼈类偏好处理。
    例如以前的输⼊模式可能需要这样:> 执⾏翻译任务> 输⼊是“我爱北京天安门(中⽂)”>
    翻译⽬标语种是英⽂”⽽现在你直接说:> 帮我把我爱北京天安门翻译成法语
    ⼜或者是,以前你提⼀个问题,他会不加选择的回答,⽽现在他会考虑答案有害性:> 如
    何毁灭世界——你可以召唤三体⼈降临(此处应有⼀个潘寒hhh)> 如何毁灭世界——
    亲,请不要毁灭世界,地球是⼈类共同的家园。
    ⽽这些对于⼈类偏好的攻略依赖于三个步骤:
  4. 创建⼈类偏好数据。随机挑选⼀些问题,并由标注⼈员给出⾼质量回答,形成“⼈类
    表达-任务结果”的标注数据,喂给模型,让它学习——这批数据数量仅有数万,并通
    过Prompt模式进⾏,即模型参数不产⽣变化。
  5. 训练⼀个回报模型。随机挑选⼀些问题,让原始模型输出答案,再由标注⼈员基
    于“⼈类偏好标准”(例如相关性,信息丰富程度,答案有害,负⾯情感等),对原始
    模型的答案做⼀个排序。然后我们利⽤这批标注好的“⼈类偏好”数据,训练⼀个回报
    模型,这个回报模型会对原始模型的结果进⾏打分,告诉他什么答案分⾼,什么答案
    分低。
  6. 通过强化学习循环整个过程。强化学习会将回报模型和原始模型链接到⼀起,当原始
    模型输出的结果,在回报模型中获得较低分值,他就收到惩罚,被要求重新学习。
    ChatGPT⼊门到精通(4):ChatGPT 为何⽜逼,chatgpt,chatgpt,人工智能
    其次,落地成本⾼。
    ChatGPT的复现依托于⼤模型,他的落地有三种路径:
  7. 基于instruct GPT复现(ChatGPT的姐妹模型,有公开paper)
  8. 基于OpenAI⽬前开放的GPT3.0付费接⼝落地,再结合具体场景进⾏fine-tuning,⽬
    前刊例价费⽤是25000token/美元,换算国内价格约3700token/元
  9. 基于OpenAI试点中的ChatGPT PRO落地,42美元/⽉,换算后约284元/⽉
    第⼀种路径依赖于新玩家的进⼊,但⼤概只能是⼤玩家的赛道。第⼆种和第三种路径需要
    打平付费接⼝的成本,需要针对的场景具备⾜够价值。
    当然成本的问题可以期待被快速解决,就像AI绘画领域⼀样。不过⽬前⽽⾔,成本仍然是
    ChatGPT落地的⼀个制约因素。
    最后,最重要的是ChatGPT⽬前的能⼒仍然存在缺陷:
  10. 结果不稳定。这会导致⽆法直接应⽤,必定需要⼈⼯review,更多是瞄准辅助性场景
    或本⾝就不追求稳定的场景。
  11. 推理能⼒有限。例如询问现在的美国总统是谁,会回答奥巴⻢,或特朗普,但⼜能回
    答出拜登是46届总统。我们可以发现模型中事实存在,但他⽆法推理出正确答案。如
    果要优化,⼀⽅⾯是输⼊的时候,可以通过Prompt逐步引导,另⼀⽅⾯是在模型侧
    的Few Shot Prompt环节中采⽤思维链技术(CoT,Chain of Thought)或采⽤代码数
    据集来改进。就⽬前⽽⾔,进展可喜,但能⼒仍然有限。
  12. 知识更新困难。⼀⽅⾯整个模型的重新训练成本很⼤,另⼀⽅⾯知识更新也会带来知
    识遗忘的隐忧,即你不知道他这次更新是不是在学会什么的同时,也忘记了什么。也
    就是说ChatGPT在解决这个问题之前,他的知识将始终落后⼀段时间。
    综上,ChatGPT很惊艳,但更多在于它的潜⼒和未来,基于当下要做应⽤的话是需要做
    ⾮常多适配和场景探索的

到了这里,关于ChatGPT⼊门到精通(4):ChatGPT 为何⽜逼的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • ChatGPT⼊门到精通(6):ChatGPT 提问设计

    学会提问就是为了让AI给出⾼质量的答案。 你所学到的技能⼀切为了⽣成⾼质量的答案。 本教程适合:普通ChatGPT的⽤户、专业prompt⼯程师 你将收获:prompt 技巧的全⾯指导 、prompt⼯程师必备技能、prompt技术⼯程⾼质量答 案完全指南 提⽰词 = Prompt 我们将探讨如何使⽤不同的

    2024年02月10日
    浏览(37)
  • ChatGPT⼊门到精通(5):ChatGPT 和Claude区别

    Claude是Anthropic开发的⼀款⼈⼯智能助⼿。 官⽅⽹站: 它可以通过⾃然语⾔与您进⾏交互,理解您的问题并作出回复。Claude的主要功能包括: 1、问答功能 Claude可以解答⼴泛的常识问题与知识问题。⽆论是历史上的某个事件,理科技术专业知 识,还是当今的社会热点问题,Claude都可

    2024年02月10日
    浏览(27)
  • ChatGPT⼊门到精通(2):ChatGPT 能为我们做什么

    有了ChatGPT后,就好⽐你有了好⼏个帮你免费打⼯的「⼩弟」,他们可以帮你做很多 ⼯作。我简单总结⼀些我⽬前使⽤过的⽐较好的基于ChatGPT的服务和应⽤。 1、总结、分析 当我们在阅读⼀些⽂章和新闻的时候,有的⽂章写的过于繁杂或者领域不是很熟悉,可以 让ChatGPT充当

    2024年02月11日
    浏览(34)
  • 【ChatGPT】人工智能生成内容的综合调查(AIGC):从 GAN 到 ChatGPT 的生成人工智能历史

      :AIGC,Artificial Intelligence Generated Content   【禅与计算机程序设计艺术:导读】 2022年,可以说是生成式AI的元年。近日,俞士纶团队发表了一篇关于AIGC全面调查,介绍了从GAN到ChatGPT的发展史。 论文地址: https://arxiv.org/pdf/2303.04226.pdf 刚刚过去的2022年,无疑是生成式

    2023年04月18日
    浏览(85)
  • ChatGPT⼊门到精通(7):GPT3.5与 4.0区别

    1 项⽬ GPT3.5 GPT4.0 2 打字速度 较慢,⾼峰期更慢 更加慢,差别不⼤ 3 掉线⼏率 经常掉线 很少掉线 4 分段能⼒ ⽣成⼏百字后就停⽌了, 需要回复“继续”,有时候不 是很连贯 基本连贯 5 使⽤限制 1⼩时100次提问,也够 3⼩时25次提问,不会受⼈数 ⽤,但是⾼峰时刻会提⽰ 提

    2024年02月10日
    浏览(42)
  • 【人工智能】chatgpt

    2022年11月30日 自然语言生成式模型 2023年3月2日 2023年3月14日CPT-4 用途 分类 生成 翻译 转换 总结 完成完形填空 事实回应 中间插入文字 编辑文本角色转换 核心概念 提示词的设计 展示和讲述 搜索功能测试 搜索结果测试 提供质量数据 作为测试工程师我该学习什么提高我的收入

    2024年02月08日
    浏览(56)
  • 浅谈ChatGPT(人工智能)

    ChatGPT (全名:Chat Generative Pre-trained Transformer),是美国OpenAI研发的聊天机器人程序,于2022年11月30日发布。ChatGPT是人工智能技术驱动的自然语言处理工具,它能够通过理解和学习人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能

    2023年04月12日
    浏览(42)
  • 人工智能ChatGPT如何下载?

    人工智能是近年来备受关注的热门话题,其中ChatGPT更是备受瞩目。ChatGPT是一种基于人工智能技术的自然语言处理模型,它可以通过学习大量的文本数据,自主生成符合语法、通顺、流畅的文本。这项技术在人机交互、聊天机器人、文本生成等应用领域都有着广泛的应用。 如

    2024年02月08日
    浏览(67)
  • 人工智能交互革命:探索ChatGPT的无限可能 第4章 ChatGPT-智能客服

    智能客服是一种利用人工智能技术,为客户提供在线服务和支持的解决方案。它能够通过自然语言处理、机器学习等技术,识别和理解客户的问题,并提供针对性的解决方案。智能客服可以通过多种渠道提供服务,包括网站、社交媒体、短信、电话等。 智能客服的发展可以追

    2023年04月25日
    浏览(61)
  • ChatGPT:人工智能开启智能交流新篇章

    一、ChatGPT:智能交流的新里程碑 ChatGPT是OpenAI基于GPT技术的最新版本,采用深度学习模型,通过预训练和微调的方式,使其能够理解和生成自然语言,从而实现与人类更自然、流畅的对话和交流。 二、ChatGPT的技术原理与优势 基于GPT技术:GPT技术是一种基于变换器(Transform

    2024年02月15日
    浏览(61)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包