用这三本书,探究 ChatGPT 的底层逻辑

这篇具有很好参考价值的文章主要介绍了用这三本书,探究 ChatGPT 的底层逻辑。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

最近爆火的ChatGPT能够很好地理解人类的语言,并以流畅且符合逻辑的自然语言来反馈。刚刚发布的GPT-4更是在各种学科考试(美国高考SAT、研究生入学考试GRE等)和专业考试(律师考试等)中能拿到前10%的成绩。某种程度上,智能已经接近人类的水平,这是之前人工智能系统无法想象的。

大家可能都很好奇,人工智能是怎么做到的?究竟发生了什么?背后的原理是什么?

ChatGPT的底层技术,其实是大规模深度神经网络,也就是深度学习。“鉴往”才能“知来”,关于这段历史,在《人工智能简史》第5章“神经网络简史”中有非常精彩的描述。简述一下:最初,神经网络出自控制论之父维纳研究团队的McCulloch和Pitts在1943年发表的论文(McCulloch是精神病学系的教授,而当时Pitts才20岁,高中辍学)。1957年,Rosenblatt发明的感知机爆红,当时连美国国防部和海军都资助了他的研究工作,Rosenblatt也一改往日的害羞,经常在媒体出镜,他开跑车,弹钢琴,到处显摆。这使得另一派的人相当不爽,Minsky坚定认为,神经网络不能解决人工智能的问题,还在书中证明单层神经网络连计算机最基础的异或问题都无法解决,在Minsky的“强大攻击”下,Rosenblatt最终遭遇不幸(1971年,Rosenblatt在生日当天划船时淹死,很多人认为他是自杀。此外有证据表明,Rosenblatt和Minsky很早就有瓜葛,两人是中学同学。而且早期,Minsky是神经网络的支持者)。到了七八十年代,只剩早期神经网络研究的“幸存者”Hinton等人在学术界边缘苦苦坚持。终于到2012年,Hinton的得意门生Ilya Sutskever通过AlexNet解决视觉识别问题,一举天下闻。而GPT系列更是Ilya在OpenAI率领一众年轻生力军几年磨一剑,通过攻破语言问题,实现人工智能有史以来最大突破。

目前,深度学习方面有很多书,但大部分机器学习的内容比较多,偏数学、理论,不容易懂,而且很多技术细节在大模型时代也没那么重要了。要更直接、深入地理解神经网络,图灵有两本书是最适合的。一本是鱼书,一本是苹果书。

“鱼书”即《深度学习入门:基于Python的理论与实践》,最近不少人在用它恶补深度学习基础知识:

用这三本书,探究 ChatGPT 的底层逻辑

这是一本真正意义上的“入门书”!书中没有使用内容不明的黑盒,而是从我们能理解的最基础的知识出发,一步一步地实现最先进的深度学习技术。

美国物理学家费曼说:“What I cannot create,I do not understand.” 只有创造一个东西,才算真正弄懂了一个问题。这本书就是教你如何创建深度学习模型。跟随这本书,你将从零开始编写可实际运行的程序,一边看源代码,一边思考。作者斋藤康毅坚信,这种做法对正确理解深度学习是很重要的。

如果把《深度学习入门》比作一本关于汽车的书,那么本书并不会教你怎么开车,而是要让你理解汽车的原理。因此,会带领你打开汽车的引擎盖,把零件一个一个地拿在手里观察,并尝试操作它们。之后,用尽可能简单的形式提取汽车的本质,并组装汽车模型。

本书畅销多年,在豆瓣上获得 9.5 分好评!

用这三本书,探究 ChatGPT 的底层逻辑

上周五,云风大佬就在 Twitter 晒了自己的正在读这本《深度学习入门》:

用这三本书,探究 ChatGPT 的底层逻辑

这条信息还吸引来了作者斋藤康毅:

用这三本书,探究 ChatGPT 的底层逻辑

进而引起了大家对这本“鱼书”的讨论,纷纷认可这是一本不可多得的入门好书!

用这三本书,探究 ChatGPT 的底层逻辑

用这三本书,探究 ChatGPT 的底层逻辑

用这三本书,探究 ChatGPT 的底层逻辑

用这三本书,探究 ChatGPT 的底层逻辑

第二本是 OpenAI 总裁兼董事长 Greg Brockman 的 AI 入门读物“苹果书”——《深入浅出神经网络与深度学习》:

用这三本书,探究 ChatGPT 的底层逻辑

Greg Brockman 说:在成为 OpenAI 的 CTO 之前,我原本对 AI 和机器学习知之甚少。幸运的是,我有一些在 AI 专家的朋友,包括 Dario Amodei 和 Chris Olah。我问他们一些建议,他们给了我一些很好的初学者资源。其中最有用的是 Michael Nielsen 的书 Neural Networks and Deep Learning,读完之后,我在 Kaggle 上实践了自己的新技能。在参加的第一场比赛中,我甚至一度是第一名!

用这三本书,探究 ChatGPT 的底层逻辑

用这三本书,探究 ChatGPT 的底层逻辑

Neural Networks and Deep Learning by Michael Nielsen
图灵将这本书翻译为中文后,给它取了一个好记的名字:苹果书。苹果书真正做到了理论与实践并重。首先,这本书细致地探讨神经网络和深度学习的核心概念,而不是笼统地罗列想法。这些核心概念是理解其他新技术的基础,类比学习编程语言的话,这相当于掌握一种新语言的核心语法、库和数据结构。你可能只了解某一门编程语言的一小部分,但新的库和数据结构会容易理解。毕竟,技术兴衰起落,而原理是长久的。
其次,本书将通过几十行代码,且不涉及特别的库,教计算机识别手写数字。然后通过多次迭代来改进程序,贯彻神经网络和深度学习的核心思想,同时开发一个小型神经网络库,让你可以方便地多次试验、加强理解。因此基于本书内容,你可以构建出一个功能完备的生产级神经网络库。希望有了理论和实践的基础,你可以走得更远。

此外,本书还得到了李航、马少平等多位科学家重磅推荐:

这是一本非常好的深度学习入门书,相信一定会得到大家的喜爱。

——李航字节跳动科技有限公司人工智能实验室总监
ACL会士、IEEE会士、ACM杰出科学家
这本书从神经网络和深度学习的基本原理入手,详细地解释了神经网络和深度学习的核心概念,兼顾理论和实践,是深入了解神经网络和深度学习的一本好书。

——马少平
清华大学计算机系教授
博士生导师
我从看完第1章开始就被其深入浅出的文字以及清晰的代码实现所吸引。我相信,这本书的正式出版一定会让更多的读者受益。

——车万翔
哈尔滨工业大学计算机科学与技术学院信息检索研究中心教授
博士生导师
这是一本独特且有趣的神经网络入门书,其细致程度基本上做到了手把手教学,非常适合初学者。我期待这本书能照亮更多人的人工智能之路。

——俞扬南
京大学人工智能学院教授
博士生导师
这是一位物理学家写的机器学习书,内容清晰易懂,对神经网络的描述也直观形象,非常适合用来入门神经网络和深度学习。

——邱锡鹏
复旦大学计算机学院教授
博士生导师
这是一本关于神经网络和深度学习的“亲近”易读的书,它将带领你轻松入门人工智能世界。

——张伟楠
上海交通大学计算机科学与工程系副教授
博士生导师
这本不可多得的好书通过丰富的示例和代码实践做到了知行合一。

——王昊奋
同济大学特聘研究员
OpenKG联合创始人
这本量子物理学家笔下的好书以一个个生动的实例驱动你恨不得一口气读完!

——徐涵
华为欧洲研究院高级战略规划经理

被这么多靠谱的大佬推荐的好书,绝对值得信赖~

步入GPT时代,相信你我都意识到了:学习 AI 基础知识,再也不是“只有研究 AI 的人需要”,我们每个人都该了解,如果你打算了解人工智能,使用人工智能,那么本文提到的三本书,都可以闭眼入!

最后,和大家分享一张 2018 年利用假期时间疯狂学习的 Greg Brockman,共勉!
用这三本书,探究 ChatGPT 的底层逻辑
图片文章来源地址https://www.toymoban.com/news/detail-427137.html

到了这里,关于用这三本书,探究 ChatGPT 的底层逻辑的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 吴恩达ChatGPT课爆火

    点上方 计算机视觉联盟 获取更多干货 没想到时至今日,ChatGPT竟还会犯低级错误? 吴恩达大神最新开课就指出来了: ChatGPT不会反转单词! 比如让它反转下lollipop这个词,输出是pilollol,完全混乱。 哦豁,这确实有点大跌眼镜啊。 以至于听课网友在Reddit上发帖后,立马引来

    2024年02月09日
    浏览(44)
  • 从汇编代码探究函数栈帧的创建和销毁的底层原理

    人,只有在放弃战斗的时候才算输,只要坚持战斗,就还没输  本文收录于青花雾气-计算机基础 往期回顾 从0到1搞定在线OJ 数据在内存中的存储 计算机存储的大小端模式 目录 一、先导知识 二、函数调用堆栈 三、函数栈帧的创建 1.创建函数栈帧 2.创建变量 3.函数传参 4.函数

    2024年02月08日
    浏览(38)
  • 【深入探究人工智能】逻辑函数|线性回归算法|SVM

    🎉博客主页:小智_x0___0x_ 🎉欢迎关注:👍点赞🙌收藏✍️留言 🎉系列专栏:小智带你闲聊 🎉代码仓库:小智的代码仓库 机器学习算法是一种基于数据和经验的算法,通过对大量数据的学习和分析,自动发现数据中的模式、规律和关联,并利用这些模式和规律来进行预测

    2024年02月08日
    浏览(57)
  • 一本书讲透ChatGPT——理论与实践的完美结合,大模型技术工程师的必备指南

    OpenAI 在 2022 年 11 月推出了人工智能聊天应用—ChatGPT。它具有广泛的应用场景,在多项专业和学术基准测试中表现出的智力水平,不仅接近甚至有时超越了人类的平均水平。这使得 ChatGPT 在推出之初就受到广大用户的欢迎,被科技界誉为人工智能领域的新里程碑。 人们在为生

    2024年03月13日
    浏览(38)
  • 爆火的 ChatGPT 会让客服岗位消失吗?

    近日,由 OpenAI 推出的 ChatGPT 在全球互联网爆火。具体有多火呢?根据 OpenAI 的 CEO Sam Altman 的说法:上周三才上线的 ChatGPT,短短几天,用户数已突破 100 万大关。 那么,ChatGPT 是什么呢? 简单来说,ChatGPT 是一款任务型的多轮对话/问答系统。按照官方的说法,ChatGPT 也是一款

    2023年04月09日
    浏览(40)
  • ChatGPT爆火,推荐几款可能非常有用的ChatGPT相关AI工具清单

    目前最火出圈的工具,无需赘言 ChatGPT Plugins 是专为以安全为核心原则的语言模型设计的工具,可帮助 ChatGPT 获取最新信息、运行计算或使用第三方服务。被邀请退出候补名单的插件开发者可以使用该文档为 ChatGPT 构建一个插件,然后在向语言模型显示的提示中列出已启用的

    2024年02月01日
    浏览(58)
  • InnoDB 引擎 底层逻辑

    目录 0 课程视频 1 逻辑存储结构 1.1 结构图 1.2 表空间 - 记录 索引 存储记录 等数据 1.2.1 储存在 cd/var/lib/mysql - ll - 目录 mysql.ibd 1.3 段 - 索引 存储记录 具体存储 1.3.1 数据段 b+树 叶子节点 1.3.2 索引段 b+树的 非叶子节点 1.3.3 回滚段 1.3 区 - 1M = 16k * 64页 1.4 页 - 磁盘管理最新单

    2024年02月02日
    浏览(53)
  • 爆火的 ChatGPT,会成为程序员的 “就业杀手” 吗?

    即使你过去从不关心科技领域,最近应该都被一个叫 “ ChatGPT ” 的人工智能刷屏。 与上一任 “全球网红” 元宇宙不同,这位新晋的 “全能网友” 来势汹汹,互联网上盛传它将要抢走一大批人的饭碗。 有人认为,随着 ChatGPT 技术的成熟和应用,底层程序员将面临失业的风

    2023年04月25日
    浏览(43)
  • ChatGPT爆火| 微软ATP推出教师AI素养提升秘籍

    最近全球爆火的ChatGPT,让我们领略AI技术的迅猛发展,尤其在自然语言处理(NLP)、机器学习(ML)等方向与教育的结合日趋紧密,人工智能在教育领域中的应用呈现出快速增长的趋势。 几乎是在一夜之间 ChatGPT刷爆网络和朋友圈 “ChatGPT上线2个月活跃用户破亿” “ChatGPT会不

    2024年02月05日
    浏览(96)
  • ChatGPT爆火,对制造业销售增长的AI建议

    北京时间2023年2月8日,微软宣布推出由ChatGPT支持的最新版本人工智能搜索引擎Bing(必应)和Edge浏览器。 ChatGPT的问世再次掀起AI热潮。 接下来让我们一起试试与ChatGPT对话,看看传说中上知天文下知地理的他是如何回答工业制造业企业销售增长的问题。 3D产品配置器能否助推

    2024年02月09日
    浏览(41)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包