< 每日闲谈:你真的了解 “ ChatGPT ” 嘛 ? >

这篇具有很好参考价值的文章主要介绍了< 每日闲谈:你真的了解 “ ChatGPT ” 嘛 ? >。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

< 每日闲谈:你真的了解 “ ChatGPT ” 嘛 ? >


👉 前言

相信小伙伴们最近肯定没有少从互联网上听到关于 ChatGPT 的信息,最近越来越多和 **ChatGPT ** 相关的 Ai 人工智能内容的工具被宣传出来。也越来越多行业直接或者间接受到 “Ai” 的影响,衍生出了相关的新兴职位,例如: Ai插画师、AI提词工程师、Ai艺术画师等等。所以,清楚的了解认识它,非常有必要!

随着 “ ChatGPT ” 越来越火,即使是在国内,除了技术爱好者和相关从业人士,甚至在很多娱乐新闻上都能看到它的身影。前阵子还上了抖音的热榜,这对于一个技术产品来讲的确是非常难得,非常出圈的一件事。

So, it is 何方神圣? 接下来,就由小温带小伙伴们来认识一下它!

👉 OpenAI的创立

OpenAI 是现在世界上最顶级的人工智能实验室之一,其创始人之一正是鼎鼎有名的明星企业家马斯克。马斯克一直是AI威胁论的支持者,他认为在未来AI会威胁到人类社会,但他觉得避免AI潜在威胁的最好方式并不是去限制它,而是透明化地研究它,开放他,普及他,避免巨头垄断。

2015年底马斯克作为创始人之一的身份和硅谷大佬共同创建了明星企业 OpenAI 。起初OpenAI的定位是一家非盈利专注于人工智能研究的实验室,但是现在也有商业化的部分。其使命是通过研发一种高度自主且在大多数具有经济价值的工作上超越人类的系统。

OpenAI注重在AI领域的理论研究,公司成立以来发表了很多显著的研究成果,与其他巨头相比,OpenAI更注重开源分享,因此每年都会发布一些有影响力的开源作品或平台,使得OpenAI每次发布开源作品时,都会受到业内人士的广泛关注。

👉 ChatGPT有何过人之处?

于 2022.12 OpenAI 推出了他们的最新之作 ChatGPT,一经推出就获得大量关注,据官方统计ChatGPT推出一周的时间,线上体验用户已超过一百万,那他到底有何神奇之处,能引起如此大的关注呢?

强烈建议大家自己去官网体验一下,不过需要先注册,但ChatGPT对国内用户非常不友好,可以说是能封住的地方都封住了(估计是和国家间政策处理有关),所以注册一个ChatGPT账号对国内用户来讲也是一件成本很高的事。我总结了一下注册账号的教程,放在末尾章节,有需要的可以根据它去尝试注册。

这里有我体验的一些示例,效果确实很惊艳。

> 效果演示

  1. 严谨知识类: 知识类的问题,对于来ChatGPT说是小菜一碟,每次对话都非常好的保留上下文的语义环境,让沟通很顺畅。

< 每日闲谈:你真的了解 “ ChatGPT ” 嘛 ? >

  1. 开放性知识类: 回答准确,解答详细,贴近人类生活,会给出靠谱的建议。

< 每日闲谈:你真的了解 “ ChatGPT ” 嘛 ? >
< 每日闲谈:你真的了解 “ ChatGPT ” 嘛 ? >

  1. 世纪难题,无合适答案类: 对于这种无理的问题,ChatGPT显得有点滑头,虽然它给出了看起来说的过去的答案,但显得太过官方,无论问它多少遍它的答案都不会是妈妈或者是妻子,更不会从法律等一些客观角度给出结论,因为无论如何选择,答案都是反人性的,ChatGPT不会给出引发争论的、有毒的、坏的答案,从中也能看出它并不是野蛮生长,而是有着这人类干预和调教的过程,如果你一再逼问,它最终会拒绝回答。

< 每日闲谈:你真的了解 “ ChatGPT ” 嘛 ? >
< 每日闲谈:你真的了解 “ ChatGPT ” 嘛 ? >

  1. 更感性更具有人类情感的问题: 即使是人类中很感性的问题,ChatGPT一般也能给出比较合理的答案,而由于人类的干预和调教,它的价值观会更加注重让你尊重对方,而不是为你得坏心思提供方法,ChatGPT并不缺少方法,很多问题往往需要换一个问法它才能给出让人满意的答案。

< 每日闲谈:你真的了解 “ ChatGPT ” 嘛 ? >
< 每日闲谈:你真的了解 “ ChatGPT ” 嘛 ? >
< 每日闲谈:你真的了解 “ ChatGPT ” 嘛 ? >

  1. 创作能力: 根据简单的故事情节要求,创作了小芳和小明的爱情故事,几乎能让人无法分辨是机器还是人的创作,非常有意思。

< 每日闲谈:你真的了解 “ ChatGPT ” 嘛 ? >
< 每日闲谈:你真的了解 “ ChatGPT ” 嘛 ? >

  1. 代码编写能力: 按要求代码编写,动态输入指令,代码纠错,编码能力合格。

< 每日闲谈:你真的了解 “ ChatGPT ” 嘛 ? >

👉 OpenAI看家之作 — GPT自然语言模型

< 每日闲谈:你真的了解 “ ChatGPT ” 嘛 ? >

美国人工智能研究实验室 OpenAI 于 2023.04.04 为其热门聊天机器人 ChatGPT 发布了最新的 GPT-4 语言模型,距 ChatGPT 推出仅 4 个月。

与ChatGPT最初使用的GPT-3.5模型相比,GPT-4在几个方面实现了跨越式改进:强大的图像识别能力;文本输入限制增加到 25,000 字;回答准确率显着提高;生成歌词的能力,创意文本,实现风格变化。

据悉,OpenAI从2018年开始发布GPT语言模型,GPT-3是GPT语言模型的第三个版本。聊天机器人ChatGPT将于2022年发布,其免费版使用的模型为GPT-3.5。

GPT-4是OpenAI发布的最新最强大的大规模语言模型,其AI能力强于以往任何GPT模型。

> GPT发展史

< 每日闲谈:你真的了解 “ ChatGPT ” 嘛 ? >

之所以叫它ChatGPT,是因为它使用了一个叫GPT的自然语言模型,GPTopenAI的一个自然语言处理的模型,到今天已经发展到了第四代。

从GPT发布史来看从18年到20年发布到GPT3后,就没有GPT大版本发布了,这个和GPT3的训练方式也有关系,年初发布的instructGPT和chatGPT都是在此基础上的微调版本,chatGPT能达到如此惊艳的效果也全仰仗GPT3模型,那它为什么如此之强呢。

> 里程碑-GPT3

< 每日闲谈:你真的了解 “ ChatGPT ” 嘛 ? >
事实上GPT3相比较上代并没有太大结构上的差异,它之所以这么强主要是因为OpenAI的土豪式的训练方式。从上图可以看出,GPT3相比较GPT2训练的参数量从15亿跃升至1750亿,提高了一百多倍!数据量也达到了45TB。

GPT3通过海量到夸张的数据量,远远超越现有的所有自然语言模型,达到了惊艳的效果,同时1200万美元的巨大训练花费,也是绝大多数企业无法负担的,甚至GPT3自爆训练过程出现一个bug,OpenAI也没有资金重新训练了。

> 从数据到AI — ChatGPT模型训练之路

< 每日闲谈:你真的了解 “ ChatGPT ” 嘛 ? >

数据有了,那ChatGPT是如何被训练成一个如此智能的聊天工具的呢,总的来说可以分为以下四个部分:

1.学习文字接龙

先看下GPT如何补全一个完整的句子,首先GPT在网络上收集它看到的所有句子,这样当有文字输入后,GPT选择用哪个文字去对输入的文字做补充,形成完整的句子。

那GPT学习了那么多的句子,它怎么知道该用哪个做补全?所以GPT的输出是几率分布的,学习了所有与这个文字相关的句子,按几率大小,从其中随机抽取出来补全(每次都不一样)。

< 每日闲谈:你真的了解 “ ChatGPT ” 嘛 ? >

比如它收集的句子中50% “你好” 后面都接 “美”,那当输入“你好”时,GPT就有50%的几率选择用“美”补全,这样GPT就能将字组装成有意义的句了

< 每日闲谈:你真的了解 “ ChatGPT ” 嘛 ? >

2.人类老师引导文字接龙方向

可仅仅是文字接龙,GPT只能产出有意义的句子,还远远无法达到问答的要求,所以就来到了有人类老师介入的第二个阶段,引导文字接龙方向,让GPT知道人类一般想要得到的句子是什么样的。

< 每日闲谈:你真的了解 “ ChatGPT ” 嘛 ? >
通过输入一批代表性的问题和标准答案,让GPT熟悉人类常用的提问模式和想得到的答案类型,起码知道当输入一个问题时,要返回一个陈述句而不是疑问句,不需要穷举所有问题,只是让GPT了解大概偏好 这样GPT筛选出一部分更加贴近人类的答案,抛弃掉很多无用数据。

3.模仿人类制定的偏好,训练老师模型

经过人类引导后,GPT可能对一个输入有多个输出,都符合人类引导的偏好,但是如何进一步在这些输出中,能有更大几率挑选到更优质的答案呢,就需要人类的打分系统

通过ChatGPTopenAI开源的API,GPT得到越来越多的人类向他提出的问题,GPT会对这些问题输出多个答案,雇佣很多人类老师给GPT的多个答案打分,人类老师不需要告诉GPT标准答案,只需要对GPT已有答案进行打分,GPT慢慢就会了解那些答案是更优质的答案。

< 每日闲谈:你真的了解 “ ChatGPT ” 嘛 ? >

通过这些数据训练一个模仿人类老师打分标准的老师模型,用这个模型代替人类,去给GPT模型做打分训练,减少人工成本,GPT模型的答案越来越优质,越来越贴近人类喜好。

4.用增强式学习向模型老师学习

GPT 将输入的问题和它返回的输出的答案,给到老师模型,老师模型已经学会了人类的喜好(如: 老师模型知道输入是个问句,输出如果是问句就给低分,因为用户肯定是希望得到一个答案),他会给 GPT 的输出打分,帮助 GPT 模型训练。

< 每日闲谈:你真的了解 “ ChatGPT ” 嘛 ? >

训练不需要人类,模型可以一直不断的自我训练,自我完善,越来越贴近人类需求。

> 特性总结

  1. 避免专业方向调优使模型更加通用
  2. 无法复制的海量学习数据
  3. 极强的上下文连接能力
  4. 对用户真是意图的理解更深入
  5. 善于处理广泛的知识和逻辑理解
  6. InstructGPT有毒回答改了减小25%
  7. InstructGPT的71%-88%的结果符合人类喜好

👉 ChatGPT国内用户注册方法

  1. 需要海外VPN节点(非国内、香港)
  2. 需要非国内邮箱(可用注册Outlook,Gmail很方便)
  3. 需要海外国家手机号验证码(可用sms-activate.org接码平台,选择ChatGPT,接收一条验证码大概几块钱)
  4. 官网地址注册(https://beta.openai.com/signup)

参考文献

  1. OpenAI 中文文档
  2. 预训练语言模型之GPT-1,GPT-2和GPT-3
  3. Training language models to follow instructions with human feedback
  4. OpenAI Codex 论文精读【论文精读】
  5. GPT——生成式预训练Transformer
  6. GPT-4 正式发布!如何接入?如何免费使用GPT-4?

往期内容 💨

🔥 < 每日算法 - JavaScript解析:搜索旋转排序数组 >

🔥 < CSS小技巧:类似photoShop的混合模式(mix-blend-mode / background-blend-mode)使用 >

🔥 <开源: 推荐10个开源的前端低代码项目>

🔥 < CSS小技巧:那些不常用,却很惊艳的CSS属性 >

🔥 < 开源项目框架:推荐几个开箱即用的开源管理系统 - 让开发不再复杂 >文章来源地址https://www.toymoban.com/news/detail-427661.html

到了这里,关于< 每日闲谈:你真的了解 “ ChatGPT ” 嘛 ? >的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • ChatGPT:你真的了解网络安全吗?浅谈网络安全攻击防御进行时之传统的网络安全

    ChatGPT(全名:Chat Generative Pre-trained Transformer),美国OpenAI 研发的聊天机器人程序,是人工智能技术驱动的自然语言处理工具。 基于其语言模型庞大、可控制、具有高度扩展性的特点,本文通过对话ChatGPT,浅谈网络安全攻击防御进行时。 ChatGPT:你真的了解网络安全吗?浅谈

    2024年02月06日
    浏览(37)
  • 【周末闲谈】剑指offer,了解面试,学会面试

    我们在找工作时,需要结合自己的现状,针对意向企业做好充分准备。作为程序员,你有哪些面试IT技术岗的技巧? 你可以从一下几个方向谈谈你的想法和观点。 个人主页:【😊个人主页】 系列专栏:【❤️周末闲谈】 你是否在为未来可能到来的面试感到担心受怕,别害怕

    2024年02月15日
    浏览(41)
  • 【周末闲谈】超越ChatGPT?科大讯飞星火认知大模型

    个人主页:【😊个人主页】 系列专栏:【❤️周末闲谈】 ✨第一周 二进制VS三进制 ✨第二周 文心一言,模仿还是超越? ✨第二周 畅想AR 哈喽大家好啊,愉快的周末又到了,5月6号,号称超越了ChatGPT的科大讯飞星火认知大模型终于与我们正式见面了,在发布会的现场,刘聪

    2024年02月05日
    浏览(42)
  • 低代码,你真的了解吗?真的那么火吗?

    近几年来,在国内讨论低代码的场合越来越多,任何技术峰会,少不了会提及低代码甚至零代码。 简单地说,低代码平台是一种软件开发工具,旨在让用户使用最少的编码知识和手动编程工作来构建应用程序。这些平台提供了图形化的用户界面和可视化工具,使用户能够通过

    2024年02月03日
    浏览(48)
  • 你真的了解低代码吗?

    🐱 个人主页: 不叫猫先生 ,公众号: 前端舵手 🙋‍♂️ 作者简介:2022年度博客之星前端领域TOP 2,前端领域优质作者、阿里云专家博主,专注于前端各领域技术,共同学习共同进步,一起加油呀! 💫优质专栏: vue3+vite+typeScript从入门到实践 📢 资料领取:前端进阶资料

    2024年02月05日
    浏览(41)
  • 你真的了解Zookeeper吗?

    在分布式系统中,Zookeeper是一款非常重要的分布式协调服务框架。本文将深入介绍Zookeeper的基本概念、核心特性,并通过实际案例展示Zookeeper在分布式系统中的应用。 Zookeeper是一种分布式协调服务,它提供了一个简单的文件系统命名空间和一个基于观察者模式的分布式服务。

    2024年02月02日
    浏览(36)
  • 你真的了解AIGC吗?

    AIGC是什么? AIGC是Artificial Intelligence Governance Certification(人工智能治理认证)的缩写。它是由中国人工智能学会(CAAI)推出的一项认证制度,旨在为从事人工智能相关领域的企业和个人提供专业的认证服务,以推动人工智能的健康、可持续发展。 AIGC与AI的区别是什么? 人工

    2024年02月10日
    浏览(32)
  • 你真的了解token续期嘛?

    在这个示例中,我们将使用Spring Boot作为后端框架,Vue作为前端框架,演示如何在全栈应用中实现长短Token的续签。 在Spring Boot中,我们首先创建一个服务来生成JWT Token。使用 jjwt 库,确保在 pom.xml 文件中添加以下依赖: 然后,创建 JwtTokenService 服务: 添加生成短Token的方法:

    2024年01月17日
    浏览(39)
  • 您真的了解全电发票吗?

    全电发票的全称是:全面数字化的电子发票,是与纸质发票具有同等法律效力的全新发票,不以纸质形式存在、不用介质支撑、无须申请领用、发票验旧及申请增版增量。纸质发票的票面信息全面数字化,将多个票种集成归并为电子发票单一票种,全电发票实行全国统一赋码

    2024年02月02日
    浏览(34)
  • 陶瓷电容(MLCC),你真的了解吗?

    摘要:本文主要介绍陶瓷电容(MLCC)的结构、阻抗-频率特性、直流偏压特性、温度特性和关键参数。 多层片式陶瓷电容器(Multi-layer Ceramic Capacitor,MLCC)是由极薄的陶瓷介质膜片和印刷在陶瓷片上面的电极材料(多数为镍)以错位方式层叠而成。 电容容值计算公式如下: C = ϵ S 4 π

    2024年02月03日
    浏览(35)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包