人工智能 | 一文介绍五种基本 Agent

这篇具有很好参考价值的文章主要介绍了人工智能 | 一文介绍五种基本 Agent。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

在讨论智能化 Agent 之前,我们首先来了解一下,什么是 Agent?

Agent 是一个通过传感器感知所处环境、通过执行器对环境产生作用的东西。

如果将人类看成一个 Agent,那么传感器就是眼睛、耳朵等器官,执行器就是手、腿等身体的其他部位。

接下来,我们就来介绍一下五种基本的 Agent,包括:

  • 简单反射型 Agent
  • 基于模型的反射型 Agent
  • 基于目标的 Agent
  • 基于效用的 Agent
  • 学习 Agent

简单反射型 Agent

简单反射型 Agent 基于当前的感知选择行动,忽略其余的感知历史

简单反射型 Agent 的结构如下:

agent模型的例子,课程复习,人工智能

  • 传感器:感知当前所处的环境
  • 条件 - 行动准则:根据感知信息匹配相应的行动规则。
  • 执行器:执行相应的动作,对环境产生作用。

简单反射型 Agent 可以通过建立一个通用的条件 - 行动规则解释器,然后对特定任务环境创建规则集合来实现。例如,在驾驶系统中创建一个规则,即如果前方的车辆在减速刹车,那么系统也开始控制车辆减速刹车。

实现的伪代码如下:

agent模型的例子,课程复习,人工智能

基于模型的反射型 Agent

基于模型的反射型 Agent 在简单反射型 Agent 的基础上,维持了一个取决于历史的内部状态,从而反映当前状态的某些不可观察的方面。为了随时更新内部状态,需要加入两种类型的知识:

  1. 关于世界如何独立于 Agent 而发展的信息。 例如:超车的汽车在下一时刻会从后方赶上来,更靠近本车。
  2. 关于 Agent 自身的动作如何影响世界的信息。例如:当 Agent 顺时针转动方向盘时,汽车向右转。
    这种关于世界如何运转的知识,称为世界模型。使用这样模型的 Agent 称为基于模型的 Agent
    深度学习中的 LSTM(长短时记忆)、和注意力机制等属于基于模型的反射型 Agent

基于模型的反射型 Agent 结构如下:

agent模型的例子,课程复习,人工智能

实现的伪代码如下:

agent模型的例子,课程复习,人工智能

  • rules 代表世界如何演变。
  • 初始的 action 代表我做过什么,更新后的 action 表示现在应该采取什么行动。

基于目标的 Agent

基于目标的 Agent 不仅需要当前状态的描述,而且需要某种目标信息来描述想要达到的状况。例如:乘客的目的地。Agent 程序会把目标信息和可能动作的结果结合起来,评估不同动作的优劣,从而选择最有利于实现目标的动作。【路径规划、8 数码问题等属于基于目标的 Agent

基于目标的 Agent 结构如下:

agent模型的例子,课程复习,人工智能

基于模型和目标的 Agent,既要追踪记录世界的状态(前方车辆是否减速、后方车辆是否准备超车),又要记录要达到的目标集(车辆行驶的目的地),并选择能最终到达目标的动作(方向盘不同还是左打右打)

基于效用的 Agent

在很多环境下,单靠目标很难产生好的行为。例如:有很多路线可以令出租车到达目的地。但是有的路线更快、更安全、更可靠、或者更便宜。如果一个世界状态比另一个更受偏好,则对 Agent 来说有更高的效用。

基于效用的 Agent 在目基于目标的 Agent 的基础上,增加了一个效用模块,用于存储 Agent 对不同状态或结果的偏好或满意度。这样,Agent 就可以根据世界状态、要达到的目标集以及效用函数,选择导致最佳期望效用的动作。【机场选址、雄安新区选址、高铁路线设计、人生目标的选择等决策,属于基于效用 Agent】

基于效用的 Agent 结构如下:

agent模型的例子,课程复习,人工智能

学习 Agent

学习 Agent 可以划分为四个概念上的组件,根据外部的反馈和内部的评价来改进 Agent 的行为。

学习 Agent 结构如下:

agent模型的例子,课程复习,人工智能文章来源地址https://www.toymoban.com/news/detail-849025.html

  • 评价元件:根据固定的性能标准来评估 Agent 在环境中的行为表现,给 Agent 提供正向或反向的反馈信号,以指导 Agent 的学习过程。例如,根据棋局的优劣来给Agent一个分数;根据 Agent 是否赢得比赛来给 Agent 一个奖励或惩罚。
  • 学习元件:利用来自评价元件的反馈,评价Agent做得如何,并决定应该如何修改执行元件以在未来做得更好。
  • 执行元件:执行外部动作,同时为学习元件提供知识。
  • 问题产生器:负责提议可以产生新的、有启发式价值的经验的动作。

到了这里,关于人工智能 | 一文介绍五种基本 Agent的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 初识人工智能,一文读懂机器学习之逻辑回归知识文集(1)

    🏆作者简介,普修罗双战士,一直追求不断学习和成长,在技术的道路上持续探索和实践。 🏆多年互联网行业从业经验,历任核心研发工程师,项目技术负责人。 🎉欢迎 👍点赞✍评论⭐收藏 🔎 人工智能领域知识 🔎 链接 专栏 人工智能专业知识学习一 人工智能专栏 人

    2024年01月23日
    浏览(28)
  • 【Python | 人工智能】一文讲清AI赋能自动驾驶的底层原理

    引言 人工智能引领现代,智能AI赋能未来。 它在当今社会和科技领域中具有重要性。 本文将着重探讨人工智能对自动驾驶技术的深度赋能和应用场景等。 有时我们乘坐网约车的时候,能打到无人驾驶汽车,全程均为AI语音播报: 自动驾驶是指通过使用 各种传感器 、 计算机

    2024年02月04日
    浏览(26)
  • 【人工智能高频面试题--基本篇】

    🚀 作者 :“码上有前” 🚀 文章简介 :人工智能高频面试题 🚀 欢迎小伙伴们 点赞👍、收藏⭐、留言💬 深度学习与过往的神经网络训练方法相比有以下几个区别: 数据量和模型规模:深度学习通常需要大量的标注数据和更大规模的模型来获得较好的性能。相比之下,过

    2024年04月27日
    浏览(12)
  • 初识人工智能,一文读懂贝叶斯优化和其他算法的知识文集(8)

    🏆作者简介,普修罗双战士,一直追求不断学习和成长,在技术的道路上持续探索和实践。 🏆多年互联网行业从业经验,历任核心研发工程师,项目技术负责人。 🎉欢迎 👍点赞✍评论⭐收藏 🔎 人工智能领域知识 🔎 链接 专栏 人工智能专业知识学习一 人工智能专栏 人

    2024年01月20日
    浏览(22)
  • gpt人工智能详细介绍

    OpenAI ChatGPT不是一款普通的软件,它是由OpenAI开发的一款基于人工智能技术的自然语言生成器。因此,它并不需要像普通软件一样下载和安装在您的计算机上。 作为一个云端服务,OpenAI ChatGPT可以通过您的浏览器直接访问和使用。对于普通用户来说,最简单的方法是访问Open

    2024年02月07日
    浏览(21)
  • 人工智能芯片开发板介绍

    人工智能芯片开发板是专为开发和实现人工智能应用而设计的硬件平台。它们集成了高性能的人工智能芯片、多种传感器、丰富的接口和开发工具,为开发人员提供了便捷的环境来构建、训练和部署人工智能模型。 这些开发板具备强大的处理能力,采用GPU、FPGA或专用的AI加速

    2024年02月07日
    浏览(23)
  • 【人工智能】大模型综述 —— 一文带你理清全球AI巨头的大模型进化史

      目录 导读 家谱树——大模型的前世今生 数据——大模型的力量源泉

    2024年02月09日
    浏览(20)
  • 了解人工智能生成内容(AIGC)的基本原理和应用

    • AIGC的定义和背景 人工智能生成内容(Artificial Intelligence Generated Content,简称AIGC)是指利用人工智能技术和算法来自动生成各种形式的内容,例如文章、新闻、广告、代码等。AIGC的发展可以追溯到机器学习和自然语言处理等领域的进展,以及深度学习模型的快速发展。 •

    2024年02月03日
    浏览(30)
  • 人工智能|各名称与概念之介绍

    版权声明:转载必须注明本文转自严振杰的博客:http://blog.yanzhenjie.com 适莽苍者,三餐而反,腹犹果然;适百里者,宿舂粮;适千里者,三月聚粮。 ——庄周《逍遥游》 上文引用了战国中期先秦道家学派的代表人物庄子的逍遥游选段,翻译为白话文大致含义是:到近郊去的

    2024年03月17日
    浏览(23)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包