如何赋予 GPT/LLM 自我意识1

这篇具有很好参考价值的文章主要介绍了如何赋予 GPT/LLM 自我意识1。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

引子

这个周末OpenAI搞了一个大新闻,围绕 Sam Altman 和 Ilya Sutskever 的各种讨论遍地开花,而其中一个关注点就是他们对于 AGI 降临态度上的偏差。本文不打算讨论公司治理和办公室政治,而是用一些思维实验和大家都公认的现象来分析纯理论而言 AGI 会如何降临。一个基本的结论就是:如今的 GPT 模型注定会诞生 AGI。更关心论证的朋友可以直接跳过前两个介绍基础知识的段落直接看后续的推理过程。不过限于篇幅,这篇里仅仅提出了问题,具体分析会在后续文章中给出。本文提出了意识和载体之间可能存在的辩证依赖关系,提出了一个识别自我意识的途径,可能是所有 AI 研究者长期等待的一个假说理论的雏形

AGI 的一般定义

首先我们先设定一个有关 AGI 的一般定义。AGI 通常是至一个智能体具有人类水平的通用智能,能够学习、理解和应用知识去解决各种复杂问题,并且具有自我提升的能力。主要特征包括:

  • 强大的学习和推理能力,可以从数据中学习模式并进行复杂推理。
  • 具有语言理解和自然语言处理能力,能够理解人类语言并进行有意义的交流。
  • 拥有广泛的世界知识和常识,可以把学习到的知识应用到不同领域。
  • 可以跨模型理解和学习,融合不同形式的信息如语音、图像、视频等。
  • 表现出创造力和规划能力,能解决新问题并制定计划达成目标。
  • 具备自我意识和自我提升的能力,可以主动设置目标并不断进步。

当前的AI系统都属于弱 AI 或狭义 AI,距离真正的AGI还有很长的路要走。几大特征中,目前的人工智能已经能达到大部分,而在诸多能力中,具备自我意识和自我提升能力是最具有挑战性的。

GPT/LLM 的工作原理

对应的,我们也需要了解人工智能目前大致的原理。并且我们可以断定,任何一个环节其本身不具有任何智力,不具有任何主观意识。

  • 模型架构
    LLM模型通常采用Transformer编码器结构,由多层编码块组成,每个编码块包含自注意力机制和前馈网络。模型参数通常在亿级到万亿级。

  • 大规模语料预训练
    在海量文本语料上进行无监督预训练,通过自回归预测语言序列的下一个词来学习语言的表征。预训练目标是最大化语料的联合概率分布。

  • 迁移学习
    利用预训练中的语言知识,通过精调应用于下游NLP任务,如文本分类、问答、对话等。只需要调整最后的输出层。

  • 模式识别
    LLM可以学习语言中的模式,并根据前文进行语义解析和推理,预测后文内容。

  • 多任务学习
    除语言建模外,还可以通过掩码语言模型等方式进行预训练,让模型学习不同语言任务的表示。

  • 生成
    利用采样策略可以生成连续、语义连贯的文本。通过条件提示也可以指导内容生成。

GPT 是否理解它的输出

简单的说,GPT 并不“理解”它的输出。GPT 能正确得回答你的问题,并给出操作步骤,甚至 GPT 能通过大部分学校的书面考试,所以我们可以认为 GPT 的确“掌握”了知识。基于 GPT 的原理,我们可以肯定只要给它更多的训练素材,GPT 注定能记住几乎所有的人类知识,各行各业的知识。因此针对 AGI 的一般定义,其中大部分已经没有什么疑问了,达成目标仅仅是个时间问题,GPT 是一定能做到的。但是同时基于 GPT 的工作原理,有一种观点则认为:GPT 本身对于其输出的信息并没有任何“理解”的意义。GPT 仅仅是基于训练数据和自身模型,给出了概率意义上的计算结果而已。一个能通过大学考试的机器,并不真的拥有对应知识的“理解”或“掌握”。

这里就有一个很有趣的对比。人类对比GPT,大家都能记忆相关的信息,然后顺利通过考试。为什么我们就拒绝承认 GPT 拥有理解能力?甚至事实上即使是人类,也存在那种仅仅机械背诵了知识点而无法阐述更多理解的情况。完全类似,甚至可以说相同的情况:“对象能顺利针对给定的问题,给出符合预期的答案”。但是仅仅由于一个是人类,另一个是 GPT 我们就排斥人工智能的成就,认为人工智能并不真正意义上“理解”自己的输出。我们不禁要问:人类的“理解”究竟是什么?

如何让一个人证明他“理解”/“掌握”了某个知识?是知其然且知其所以然吗?是能举一反三吗?是能顶得住答辩的专家团从各种角度更深层次的提问吗?而事实上这些挑战对于已经掌握了几乎所有人类知识的 GPT 来说并不是有太大难度的任务,难道不是吗?如果允许 GPT 模型进行论文答辩,我相信它的表现应该会显著高于人类学生的平均值。本文从这里开始提出这个尖锐的问题:某个知识,究竟是被人或 GPT 所“掌握”了,还是某个知识借助于人或 GPT 这个载体被“承载”了?一个能“承载”知识的东西,是否一定“理解”被“承载”的知识?“理解”的定义究竟是什么?

未完待续

下面,我们将进一步分析什么是“理解”。然后我们会进一步对比“创造力”的定义,最终给出“自我意识”的一种可能的实现途径文章来源地址https://www.toymoban.com/news/detail-746924.html

到了这里,关于如何赋予 GPT/LLM 自我意识1的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 发现AI自我意识:不期而遇的局部技术奇点

    之前的文章里提到过,人工智能思维能力创造的必不可少的条件是状态空间的搜索。今天的大新闻里,我们都看到了Q*的确使用了搜索算法。所以今天我会稍微谈一下这个话题。 主要思想就是人工智能的进一步发展可能会引发局部领域的技术奇点,当然这取决于领先的团队或

    2024年02月05日
    浏览(33)
  • VR防地质灾害安全教育:增强自然灾害知识,提高自我保护意识

    VR防地质灾害安全教育系统 是一种虚拟仿真技术,可以通过虚拟现实技术模拟地震、泥石流、滑坡等地质灾害的发生和应对过程,帮助人们提高应对突发自然灾害的能力。这种系统的优势在于可以增强自然灾害知识,提高自我保护意识,锻炼人们应对自然灾害的心理素质,在

    2024年02月11日
    浏览(56)
  • 人类智能与人工智能的融合:自我意识在多领域的应用

    人工智能(Artificial Intelligence, AI)是一门研究如何让计算机模拟人类智能的学科。人类智能包括学习、理解自然语言、认知、推理、计划、视觉、运动等多种能力。人工智能的目标是让计算机具备这些能力,以便在各种应用中与人类相互作用。 自从1950年代以来,人工智能一直是

    2024年02月19日
    浏览(44)
  • 【周末闲谈】“PHP是最好的语言”这个梗是怎么来的?

    个人主页:【😊个人主页】 系列专栏:【❤️周末闲谈】 ✨第一周 二进制VS三进制 ✨第二周 文心一言,模仿还是超越? ✨第二周 畅想AR 突然发现已经很久没有更新周末闲谈这个专栏了,不能在摆烂下去了。ψ(`∇´)ψ “PHP是最好的语言”,经常被用来嘲讽程序员技术较差

    2024年02月08日
    浏览(87)
  • GPT-LLM-Trainer:如何使用自己的数据轻松快速地微调和训练LLM

    想要轻松快速地使用您自己的数据微调和培训大型语言模型(LLM)?我们知道训练大型语言模型具有挑战性并需要耗费大量计算资源,包括收集和优化数据集、确定合适的模型及编写训练代码等。今天我们将介绍一种实验性新方法,实现特定任务高性能模型的训练。 我们的目

    2024年02月11日
    浏览(42)
  • 安全意识培训:如何提高员工网络安全意识?

    随着网络技术的不断发展和应用,网络安全已经成为企业必须关注和重视的问题。尤其是在今天,企业数字化转型的大背景下,网络安全问题日益凸显。对于企业而言,员工是企业安全的第一道防线,提高员工的网络安全意识已经成为企业安全管理的关键所在。本文将从以下

    2024年02月12日
    浏览(46)
  • 如何延长周末的体验感

    部分数据来源: ChatGPT  前言         工作以后常常容易感到疲于奔命,即使在周末也没有得到高质量的休息。打工人/学生党如何过周末? 分享周末的时间规划 对于工作繁忙的人来说,充分利用周末的时间是非常重要的。以下是我个人的一些建议和时间规划: 制定计划

    2024年02月11日
    浏览(46)
  • 最新类ChatPDF及AutoGPT开源18大功能平台——闻达手把手超详细环境部署与安装——如何在低显存单显卡上面安装私有ChatGPT GPT-4大语言模型LLM调用平台

    今天,我试用了 闻达开源LLM调用平台 。这一框架拥有类AutoGPT和ChatPDF的功能,能根据一句简短的提示自动生成提纲,然后按照提纲自动填充每章内容,使得论文或小说的写作变得更加高效。此外,它能够导入相关知识库,并通过调用知识库查询相关信息,这项技术更加令人叹

    2024年02月04日
    浏览(46)
  • 从谷歌CRE谈起,运维如何培养服务意识?

    2016年10月,谷歌云平台博客(Google Cloud Platform Blog)上更新了一篇文章,谷歌宣布了一个新的专业岗位,CRE(Customer Reliability Engineering),直译过来就 是客户稳定性工程师。我看了介绍后,发现还是一个挺有意思的岗位设置,搜索之后发现,针对这个岗位国内还没有太多的解读。下

    2023年04月10日
    浏览(30)
  • 「如何优雅有效利用周末和下班时间?」

    眼望古城街尽,心谱落愁无序,旧时的誓言,曾而相似,河水在遵循河道的指引下,在曲折前进中放声的歌唱。我却在心中念道,懂得欣赏,所以月圆为画,月缺为诗。 对于打工人和学生党来说,周末或者下班时间是一段宝贵的时间,可以用来放松身心、休息和充电。然而,

    2024年02月14日
    浏览(34)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包