从四个角度全面认识 ChatGPT

这篇具有很好参考价值的文章主要介绍了从四个角度全面认识 ChatGPT。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

从四个角度全面认识 ChatGPT


当下最引人注目的语言模型 ChatGPT 如火如荼,主要还是因为其能力远远超越了传统模型。本文将对 ChatGPT 与传统模型进行对比,深入探讨 ChatGPT 具备的强大能力以及其背后的技术来源。此外还将介绍面对大语言模型时代我们应该如何去做。

传统语言模型是什么样的?

传统语言模型的实现机制其实很简单,我们可以将它理解为“文字接龙”,当我们输入一个词之后,模型会帮我们去预测下一个词是什么,将这两个词拼接之后继续预测,如此往复就形成了一段一段的整句对话。

那么语言模型究竟是如何学会人类语言机制的呢?当我们向它询问某一个问题时,这个问题就作为了语言模型的输入内容,同理它会去预测下一个单词或字符。每一组这样的数据组合都可以称为一个范例,当这样的范例足够多以后,大预言模型就会涌现出一个新能力:泛化。也就是说同一个问题,它可以自行拓展,比如说我们问:“床前明月光的下一句是什么?”模型回答“疑是地上霜”,这是正确答案。那么这时候如果将问题稍微拓展:“床前明月光的后续内容是什么?”模型也可以理解并处理,这就是所谓的泛化能力。当然这个能力是需要一个长期的训练过程和大量的数据作为支撑的。

过去一直以来的语言模型都是遵循以上机制的,讲的直白一点其实就是一个“文字接龙”机器,你问出的问题它会有对应的答案,即使换个问法可能也是该答案。相信每个人都体会到过某宝/某多/某东的机器人客服,你问一个问题它是这么回答的,换个问法它还是同样的话术,就说气不气。事实上这样的产品就是传统语言模型的典型代表。

ChatGPT 涌现出了哪些新能力?

在 ChatGPT 出世以后,与传统语言模型完全不一样了,ChatGPT 给我们的感觉就是它可以像真人一样和人正常聊天,回答各种各样的问题,甚至能理解人的感情… 很多全新的能力涌现了出来。

第一 ChatGPT 好像 全世界的知识它都会,上知天文下知地理,我们可以向它提问各领域的知识,让它帮我们写代码、写稿子等等。

case1:让 ChatGPT 讲解量子力学知识
从四个角度全面认识 ChatGPT
case2:让 ChatGPT 讲解天文学知识
从四个角度全面认识 ChatGPT
case3:让 ChatGPT 帮我们写一段 python 代码,调用 ChatGPT
从四个角度全面认识 ChatGPT
从四个角度全面认识 ChatGPT
python 语言调用 ChatGPT 模型代码如下:

import openai

def chat_with_gpt(prompt):
    # 设置你的OpenAI API密钥
    openai.api_key = 'YOUR_API_KEY'

    # 调用ChatGPT进行对话
    response = openai.Completion.create(
        engine='text-davinci-003',
        prompt=prompt,
        max_tokens=100,
        temperature=0.7,
        n=1,
        stop=None,
        temperature=0.7,
        top_p=1,
        frequency_penalty=0,
        presence_penalty=0
    )

    # 获取模型的回复
    reply = response.choices[0].text.strip()

    return reply

# 提示用户输入对话的起始语句
user_input = input("请输入你的问题或对话的起始语句:")

# 调用ChatGPT进行对话
gpt_reply = chat_with_gpt(user_input)

# 打印模型的回复
print("ChatGPT回复:", gpt_reply)

第二 ChatGPT 具有 接受“被催眠”的能力,所谓“被催眠”,就是当我们不停的告诉 ChatGPT 它是谁、它的特长是什么、它应该做什么事时,它自己就会开始按着这个逻辑去思考。当下的新型职业提示工程师就是基于此能力。

第三 ChatGPT 具有 复杂的推理能力,按道理来说“推理”应该是只有人才能做到的事情,但是现在 ChatGPT 也具备此能力,它也可以根据语义自行推理。

case4:输入一个公考推理题,让 ChatGPT 来解答
从四个角度全面认识 ChatGPT
第四 ChatGPT 具有 中立、客观、安全的语言表达能力,当我们询问问题时,ChatGPT 的回答往往是准确客观且非常具有条理性的,同时它也会在一些涉及不良影响的问题上拒绝回答。

case5:询问当下最具潜力的创业项目
从四个角度全面认识 ChatGPT

这些能力都是怎么做到的?

ChatGPT 能懂得全世界几乎所有的语言,是以海量的知识和数据作为基础的。简单来说就是将近乎所有的语料(文本)送进大语言模型当中,然后让它去预测下一个词汇是什么,与传统语言模型不同的点在于 ChatGPT 接触的预料数据是极其庞大的。下面这张表是 ChatGPT 历代版本的学习资料与模型大小:

OpenAI 学习资料 参数量
GPT1 5GB 1.17亿
GPT2 40GB 15亿
ChatGPT 45TB+ 1750亿+

从始至终语言模型的训练机制都没有变,变的只是模型的量级。俗话说“量变引起质变”,相较于传统语言模型,ChatGPT 便是一个质的改变。

ChatGPT 的复杂推理能力源于“分治思想”,将一个大问题分解为一个个的小问题,逐步解决。

为语言模型灌输知识以及其“分治”的问题处理方式,这也就是我们常说的预训练。但是预训练之后也产生了一个问题:由于预训练接触了太多的数据信息,导致模型的回答没有约束,什么都说,不管好的还是不好的!

所以接下来就需要对语言模型进行规范、矫正,让它可以按照我们期望它输出的样子进行输出。具体的方式就是将一大堆人工标注好的范例输入到语言模型当中,这里所说的“人工标注好的范例”是指人为处理过的一些数据,包括答题要求和标准答案等。通过这些范例的大量输入告诉 ChatGPT 应该如何回答。

经过以上三个方面的训练之后,ChatGPT 就已经可以很规范的回答我们的问题了。当然至此想让它具有中立、客观、安全的语言描述能力还是不够的,还需要对 ChatGPT 进行最后的创意引导,具体的做法就是让任何用户对它进行自由提问,然后 ChatGPT 无干预的自由回答,最后人工告诉它哪个回答的好,哪个回答的不好,并分别给予奖励/惩罚。这些做法是在规范 ChatGPT 的表现,使它尽可能的作出符合人类认可的回答。

综上,ChatGPT 大语言模型的训练过程为:预训练→模板规范→创意引导。正是这三个步骤,再基于超大规模的数据造就了今天的最强语言模型 ChatGPT。

在 ChatGPT 大模型时代,我们应该怎么做?

万物都是有两面性的,拥有强大能力的 ChatGPT 也无可避免的存在着一些缺陷:

  • 可能会胡编乱造;
  • 可能会混淆,把一个人身上的事情用到另一个人身上;
  • 无法直接操作,我们没有办法像操作数据库一样去操作它;
  • 还存在一定的安全隐患,如某些机密性的信息;
  • 更新效率低;
  • 无法把语言和现实进行映射。

即使再强,也还有着很大的优化空间。事实上目前还有不少人对 ChatGPT 存在着抵触心理,因为在他们的认知中,ChatGPT 会造成大量的人员失业甚至是替代人类。但我想说的是ChatGPT 并不会让你失业,熟练使用 ChatGPT 的人才会让你失业。我们应该做的是拥抱科技、拥抱 ChatGPT,接受它并优化自己的学习方法,终身学习。

只有我们自身加入到科技发展的进程中,才不会被科技发展所淘汰。文章来源地址https://www.toymoban.com/news/detail-513295.html

到了这里,关于从四个角度全面认识 ChatGPT的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 当下最强的 AI art 生成模型 Stable Diffusion 最全面介绍

    目录 模型生成效果展示(prompt 全公开) 如何注册 Stable Diffusion 使用 SD(dreamstudio.ai )的收费标注如何 SD 提供哪些参数可以设置 如何使用种子来改进一张作品 我用 SD 创作的图片著作权如何归属,可以拿来商用吗? Stable Diffusion 背后的研发团队 SD 是如何训练出来的? SD 是开

    2024年02月03日
    浏览(45)
  • 已知中心点、长宽和旋转角度,求矩形的四个顶点坐标(Python)

    本次实现有几个前提: 已知的信息如下形式:[x_center, y_center, w, h, angle],其中默认 w w w 是矩形最长的边,即 w h w h w h 。 已知的旋转角度 θ theta θ 是矩形的最长边 w w w 相对于 x x x 坐标轴的旋转角度 旋转角度 θ theta θ 的旋转区间在 [ 0 , π ] [0, pi] [ 0 , π ] 可以将情况分为两

    2024年02月05日
    浏览(76)
  • 智源AI日报(2022-08-26):当下最强的 AI art 生成模型 Stable Diffusion 最全面介绍

    【智源AI日报】每天速读5分钟,AI要事不错过! 欢迎点击这里,关注并订阅智源AI日报。 盘点 | 当下最强的 AI art 生成模型 Stable Diffusion 最全面介绍  看点:程序员漫画家西乔撰文,包括:关于SD的模型效果展示、注册方式、参数设置、收费标准、版权问题、改进方法以及SD研

    2024年02月10日
    浏览(49)
  • 浅谈当下火热的ChatGPT

            ChatGPT这个词语从今年初发布以来,一度成为一个火热的概念。包括CSDN也推出了C知道,不少大佬博友纷纷蹭热点,发布了无数关于ChatGPT的技术,使用,技能,展望未来的文档和博文。其实很多文章我都没有看过,只知道当下这个工具非常的火,火到每一个人都需

    2023年04月12日
    浏览(37)
  • 当下火爆出圈的 ChatGPT ,你了解多少?

    当下 AI 聊天程序 ChatGPT 可谓如火如荼,因它给出的答案通常更为合理且更有人情味,全网讨论度非常高。 ChatGPT 是什么? ChatGPT 是由 OpenAI 公司在 2022 年 11 月 30 日发布的一款全新聊天机器人模型,使用了包含自然语言处理(NLP)、机器学习和深度学习等最先进的人工智能技

    2024年02月01日
    浏览(70)
  • 虚拟数字人全面落地的四个挑战:技术、产品、市场、法律

    近两年,虚拟数字人随着元宇宙的风潮得到了许多人的关注。在国内,虚拟数字人在一些领域开始应用,例如直播带货、客服等。虽然虚拟数字人看起来有很好的前景,但实际上虚拟数字人要想得到全面的落实,仍然还有很长的一段路需要走,有一些挑战需要去克服。 首先是

    2023年04月10日
    浏览(38)
  • 人工智能、ChatGPT等火爆的当下 AI大模型爆发

    4月18日,火山引擎在其举办的“原动力大会”上发布自研DPU等系列云产品,并推出新版机器学习平台:支持万卡级大模型训练、微秒级延迟网络,让大模型训练更稳更快。火山引擎总裁谭待表示,AI大模型有巨大潜力和创新空间,火山引擎会服务客户做好大模型,共同推动各

    2023年04月22日
    浏览(57)
  • 网络安全行业前景,从这五个角度全面分析!

    现在的人一边在享受网络带来的便利,一边又担心网络存在的安全问题。确实如此,因此网络安全是未来比较吃香的行业,网络安全行业前景如下介绍。 1、国家十分重视网络安全 网络安全是我国维护国家安全、社会稳定,保护企业与个人隐私的前提,国家从顶层高度重视网

    2024年02月07日
    浏览(48)
  • ChatGPT4也来了,大语言模型未来可期?注重当下很关键!

    当地时间周二(3月14日), 人工智能研究公司OpenAI公布了其大型语言模型的最新版本——GPT-4 。该公司表示:“GPT-4在许多专业测试中表现出超过绝大多数人类的水平。”在内部评估中,GPT-4产生正确回应的可能性要比GPT-3.5高出40%,而且GPT-4是多模态的,同时支持文本和图像

    2024年02月11日
    浏览(40)
  • 当下流行的ChatGPT与百度的文心一言谁才是AI的霸主

    ChatGPT和百度的文心一言是两种不同的自然语言处理(NLP)AI技术,它们具有相似的功能和特点,但有着很大的差异和各自的优势。 ChatGPT是OpenAI团队开发的基于Transformer框架的大规模语言模型,是从大量自然语言数据中训练出来的一种通用语言模型,其主要应用领域为自然语言

    2024年02月12日
    浏览(34)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包