ChatGPT 速通手册——ChatGPT 的极简理解

这篇具有很好参考价值的文章主要介绍了ChatGPT 速通手册——ChatGPT 的极简理解。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

Stephen Wolfram 写了一篇文章,深入浅出的介绍了 ChatGPT 的原理。不过对于本书的读者,或者说 ChatGPT 的使用者们而言,是否掌握 Transformer、BERT、GPT、zero-shot、InstructGPT 的原理,并不影响我们基于 ChatGPT 技术进行实际运用和上层应用开发。

我们尝试让 ChatGPT 替我们总结一下文章,尽量以完全没有 IT 知识的水平来讲解。因为 ChatGPT 不能联网,所以借用 bing chat 来实现:

Q: 请帮我概述下面这个网页的内容 https://writings.stephenwolfram.com/2023/02/what-is-chatgpt-doing-and-why-does-it-work/ 按照这个内容,讲述一下 ChatGPT 的原理,要完全不懂 IT 的人也能听懂的那样浅显。 A: 好的,我可以尝试用一种简单的方式来讲述 ChatGPT 的原理。

您可以把 ChatGPT 想象成一个非常聪明的学生,它的老师给了它很多很多的书籍、文章、对话等等,让它仔细阅读和学习。这些书籍、文章、对话都是从互联网上收集来的,所以它们涵盖了各种各样的话题和风格。

ChatGPT 通过阅读这些文本,就能够学习到人类是如何使用语言来表达自己的想法和情感的。它也能够学习到不同类型和主题的文本有不同的结构和逻辑。比如说,一篇新闻报道通常会先说最重要的事实,然后再补充一些细节和背景信息;而一首诗歌通常会用比喻和押韵来增加美感和节奏。

当 ChatGPT 要生成一段文本时,它会先看看已有的文本是什么类型和主题的,然后根据自己学习到的规律和特征,来预测下一个最合理的单词是什么。比如说,如果已有的文本是“今天天气真好”,那么下一个最合理的单词可能是“我”、“我们”、“你”等等。然后 ChatGPT 会把这个单词加到已有的文本后面,再重复这个过程,直到生成一段完整的文本。

这就是 ChatGPT 的基本原理,您能听懂吗?

Q: 那么 ChatGPT 是怎么判断一个单词是否合理呢? A: ChatGPT 是怎么判断一个单词是否合理呢?这是一个很好的问题。

ChatGPT 的判断依据是它学习到的语言模型,也就是它对人类语言的规律和特征的统计和分析。它会根据已有的文本,计算出每个可能的单词出现在下一个位置的概率,然后选择概率最高的那个单词。

比如说,如果已有的文本是“今天天气真好”,那么 ChatGPT 会根据它阅读过的所有文本,计算出“我”、“我们”、“你”等等单词出现在下一个位置的概率。如果“我”这个单词出现在下一个位置的概率是0.8,“我们”是0.1,“你”是0.05,其他单词都是0.01或更低,那么 ChatGPT 就会选择“我”这个单词,因为它有最高的概率。

当然,这个概率并不是绝对准确的,因为它只能反映 ChatGPT 学习到的语言模型,而不一定能反映真实世界中人类语言的多样性和复杂性。所以有时候 ChatGPT 也会生成一些不合理或者错误的单词,比如说“今天天气真好猫”。这就需要我们对 ChatGPT 的输出进行一些检查和修正。

Q: 那么 ChatGPT 是如何学习到语言模型的呢? A: ChatGPT 是如何学习到语言模型的呢?这是一个很深入的问题。

ChatGPT 的学习过程是基于一个神经网络模型,也就是一种可以模拟人类大脑神经元之间连接和传递信息的计算机程序。神经网络模型有很多层,每一层都有很多节点,每个节点都有一些权重和偏置,这些权重和偏置就决定了节点如何处理输入和输出信息。

ChatGPT 的神经网络模型有175亿个参数(编者注:其实是 1750 亿个,bing chat 可能直译 175B 出错了),也就是175亿个权重和偏置。这些参数在初始时是随机设置的,所以 ChatGPT 一开始并不知道任何关于语言的知识。但是当 ChatGPT 阅读了大量的文本后,它就会根据文本中单词之间的关系,调整自己的参数,使得自己能够更好地预测下一个单词。

比如说,如果 ChatGPT 阅读了很多句子中都出现了“我爱”和“你”的组合,那么它就会增加“我爱”后面出现“你”的概率,并且减少其他单词的概率。这样 ChatGPT 就学习到了“我爱你”是一个常见的语言表达方式。

通过不断地阅读和调整参数,ChatGPT 就能够逐渐形成一个语言模型,也就是对人类语言规律和特征的统计和分析。这个语言模型就储存在 ChatGPT 的神经网络模型中,可以用来生成新的文本。

image::images/begin/bingchat-explain.png[]

事实上,你还可以根据 bing chat 给出的提示,继续问下去,了解ChatGPT 的神经网络算法等等。但对于普通用户而言,了解到这里,已经足够了。

为了方便,我把这些内容抽象成最简单的一句话:GPT 是按概率,一个接一个单词的输出,同时为了争取全局最优,有时也会在单个词时选择概率不是最高的。

“全局最优”这个概念很容易让人联想到围棋。人工智能领域的上一轮高潮,也正是 2016 年震惊世界的 alphago 围棋 AI。多年后,现在几乎所有围棋爱好者在看棋的时候,都会说类似这样的话:某某棋手的 AI 吻合度是多少;某一手是 AI 最优选;某一手下完以后,AI 胜率涨跌了多少……

但围棋终究是有限集合,一个棋盘就是 19 x 19 路黑白两色棋子。而人类语言无穷无尽,长篇小说的入门标准是 5 万字,严肃文学中最长小说的世界纪录是法国作家路易•法利古尔的《善心人》207 万字,网络小说中最长的是起点中文网明宇的《带着农场混异界》4385 万字(还在连载中)。此外,起点中文网曾经有人上传过一本用 VB 编程语言输出的小说《宇宙巨校闪级生》1.7 亿字,被起点以非人类原创为由下架。

所以,从“全局最优”这个角度来说,ChatGPT 在人类语言领域达到的高度,还远远比不上 alphago 在围棋领域的高度。做个不怎么贴切的对比,ChatGPT 大概也就是刚开始总结围棋“定式”的状态吧。

本节的原理解释不是为了真的阐述数学原理,而是佐证我们不应该过于相信 ChatGPT 真的是上帝式的强人工智能——换句话说:不是 ChatGPT 完成了很难的事情,而是这个事情过去被人类高估了难度。我们甚至可以做个更直接一点的比喻,ChatGPT 能写论文,是因为大多数“水”论文本来就是有迹可循的套路文章。有这个合理的心理预期,我们就可以继续接下来的学习练习了。文章来源地址https://www.toymoban.com/news/detail-416662.html

到了这里,关于ChatGPT 速通手册——ChatGPT 的极简理解的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 针对鼠标滚轮使用时滚动上下跳动失灵问题的极简有效处理办法

    首先,如果你遇到时不时的往下滚屏幕却往上跳,这种情况下基本可以肯定是鼠标自身的问题,而非电脑上的程序出错。 解决方法: 1.深吸一口气,然后深情地稳住鼠标滚轮上方(打错了,应该是吻住,但是退格离我的右手小拇指太远,探过去很累,所以懒得删了),用包裹

    2024年04月26日
    浏览(38)
  • 节省十倍代码,精益 Web 开发:Nue JS 的极简之道 | 开源日报 No.34

    Stars: 57.3k License: NOASSERTION lodash 是一个以 UMD 模块形式导出的 Lodash 库。 简化 JavaScript 编程,提供了一系列处理数组、数字、对象和字符串等操作的方法。 模块化设计,方便迭代数组、对象和字符串;操作和测试值;创建复合函数。 支持多种构建方式与模块格式:包括完整版

    2024年02月08日
    浏览(27)
  • 大一萌新の作品:红外寻迹模块做跟随小车之没有I的极简PID算法

    (纯萌新,学习单片机半年了,这是寒假回家的作品,师从江科大,写博客纪录我实现后的经验)(比较粗略) 因为没买超声波避障模块,只能勉强一下用红外寻迹做一个类似的小车。 问题很多:光线会干扰读取到的AD值,且难以设置详细的距离,只能设置大概距离;碍于萌

    2024年02月14日
    浏览(27)
  • Yolov5轻量化:CVPR2023|RIFormer:无需TokenMixer也能达成SOTA性能的极简ViT架构

     论文:https://arxiv.org/pdf/2304.05659.pdf         问题: Vision Transformer 已取得长足进步,token mixer,其优秀的建模能力已在各种视觉任务中被广泛证明,典型的 token mixer 为自注意力机制, 推理耗时长,计算代价大 。直接去除会导致模型结构先验不完整,从而带来显著的准确

    2024年02月08日
    浏览(78)
  • Yolov5涨点神器:RIFormerBlock助力检测|CVPR2023|RIFormer:无需TokenMixer也能达成SOTA性能的极简ViT架构

    目录  1.RIFormer介绍 2. RIFormer引入到yolov5 2.1在models/backbone/RIFormer.py新建  2.2 yolo修改 2.3 yolov5s_C2f_RIFormerBlock.yaml

    2024年02月09日
    浏览(33)
  • 真会玩:莫言用ChatGPT为余华写了一篇获奖词

    5月16日,《收获》杂志65周年庆典暨新书发布活动在上海舞蹈中心举行。   典礼现场,余华凭借《文城》获得收获文学榜2021年长篇小说榜榜首。   作为老友,莫言在颁奖时故意卖了个关子:“这次获奖的是一个了不起的人物,当然了,他也是我的好朋友,他不一般,所以我

    2024年02月06日
    浏览(29)
  • 我用chatgpt写了一篇关于2023 it 行业的发展的论文……

    我用chatgpt写了一篇关于2023 it 行业的发展的论文。我将从以下几个方面来探讨2023年IT行业的发展: 1.云计算技术在IT行业的应用:随着云计算技术的发展,2023年IT行业将受益于云计算技术在数据存储、计算能力和安全性方面的优势。 2.大数据技术在IT行业的应用:大数据技术的

    2024年02月07日
    浏览(38)
  • 花30分钟,我用ChatGPT写了一篇2000字文章(内附实操过程)

    有了ChatGPT之后,于我来说,有两个十分明显的变化: 1. 人变的更懒 因为生活、工作中遇到大大小小的事情,都可以直接找ChatGPT来寻求答案。 2. 工作产出量更大 之前花一天,甚至更久才能写一篇原创内容,现在有了主题、框架之后,ChatGPT 30分钟就能给我一篇「水准之上」

    2024年02月07日
    浏览(45)
  • ChatGPT自动写了个AI办公office word插件,低配copilot,程序员看了焦虑。

            最近公司文案同事提出一个需求,希望在文案编辑工作上使用AI工具,提高生产效率,当然也受ChatGPT这波潮流影响。ok,既然需求来了,作为技术部门那只能接下需求了。省略需求调研过程N个字...。总结起来:1、希望工具整合到Word中(文案编辑嘛);2、AI写作功能

    2024年02月06日
    浏览(32)
  • 【Python】极简部署私有化ChatGPT-Web,使用Flask框架编写网页版ChatGPT

    python环境下可极简配置 windows、linux、mac os均可部署 支持多用户使用 多对话管理 公式显示 流式逐字加载显示 代码高亮 仓库链接地址:https://github.com/LiangYang666/ChatGPT-Web,用的好麻烦给个star啦 可参照README 执行 python flask_main.py 运行程序.若程序中未指定apikey也可以在终端执行时

    2024年02月01日
    浏览(40)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包