国科大《高级人工智能》沈老师部分——行为主义笔记

这篇具有很好参考价值的文章主要介绍了国科大《高级人工智能》沈老师部分——行为主义笔记。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

国科大《高级人工智能》沈老师部分——行为主义笔记

  • 沈华伟老师yyds,每次上他的课都有一种深入浅出的感觉,他能够把很难的东西讲的很简单,听完就是醍醐灌顶,理解起来特别清晰
  • 今年考试题目这部分跟往年基本一样,沈老师画的重点才是真的重点

一、蚁群优化算法

  • 思想:局部随机搜索+自增强
  • 基本原理:用蚂蚁的行走路径表示待优化问题的可行解,整个蚂蚁群体的所有路径构成待优化问题的解空间。
    蚂蚁依概率选择侯选位置移动,在经过的路径上留下信息素,信息素会随时间挥发,且信息素浓度大的路径更易被选取。 最终,整个蚂蚁会在正反馈的作用下集中到最佳的路径上,此时对应的便是待优化问题的最优解。
  • 算法过程:对m只蚂蚁随机放在n个城市,按照公式选择下一个城市的概率,此时公式正比于信息素浓度;
    所有蚂蚁周游完后,更新信息素(与路的长度、挥发速度相关);
  • 适用范围:一种离散的解空间搜索方法,适用于图中找最优路径

二、粒子群算法

  • 思想:随机优化

  • 基本原理:

    • 每个粒子对应于一个可行解,粒子通过位置和速度表示(速度:下一步移动的方向和距离,位置:求解问题的一个解)
    • 粒子根据对其他个体信息+位置的评价,更新自己的速度与位置;重复直到粒子群找到问题的最优解
  • 算法过程:

      1. 初始化粒子群:随机生成粒子的位置和速度;当前粒子最优位置 全局最优位置
      1. 循环直到满足条件
      • ①计算每个粒子的适应度函数
      • ②更新每个粒子历史最好适应度+相应位置,更新当前全局最好适应度+位置
      • ③更新粒子的速度和位置:速度 = 原速度倾向 + 回到历史最优位置的倾向 + 粒子群全局最优位置的倾向
        国科大高级人工智能沈华伟2023,学校课程,# 高级人工智能,人工智能
  • 适用范围:求解连续解空间的优化问题

三、多臂赌博机

  • 优化目标:摇固定次数的臂,获得期望累计奖励最大
  • 探索与优化关系:利用(即时奖励最大化) + 探索(长期奖励最大化)
  • 乐观初值法:为每个行为赋一个高的初始估值,初期每个行为都有较大机会被explore
  • UCB:选择潜力大的行为:依据估值的置信上界行为选择(当前估值高+不确定性高)

四、马尔科夫决策过程

  • 马尔科夫决策过程:采取行动a转变为下一状态后,获得奖励
  • 要素:状态、行为、模型
  • 奖励假设:最终目标能通过最大化累计奖励实现
  • 贝尔曼方程
    国科大高级人工智能沈华伟2023,学校课程,# 高级人工智能,人工智能
    • 格子世界问题(见后)

五、策略学习

动态规划:

  • 策略估值:策略=》估值
  • 策略提升:根据当前估值=>新策略
  • 策略迭代:从初始策略开始,迭代进行策略估值和策略提升,最终得到最优策略
  • 估值迭代:从初始状态估值开始,进行估值迭代,找到最优状态估,进而根据最优估值,贪心得到最优策略

动态规划、蒙特卡洛、时序差分联系和区别(图)

  • 动态规划:一层全展开
  • 蒙特卡洛:基于经验,一条线
  • 暴力搜索:全部展开
  • 时序差分:基于经验自举,只有一步的一条线

六、博弈

  • 博弈要素:局中人(策略制定者)、策略(可供局中人选择的行动方案)、效用函数(最大化自己的效用)
  • 零和博弈:效用函数玩家收益之和为0(剪刀石头布)
  • 最佳应对:针对其他人当前策略,自己当前策略优于自己其他策略
  • 纳什均衡:相对其他局中人的最佳应对(谁动谁吃亏)
  • 社会最优:和最优
  • 帕累托最优:至少一人最优
  • 囚徒困境:
    • 帕累托最优决策组合:(坦白,抗拒),(抗拒,坦白)和(抗拒,抗拒)
    • 纳什均衡策略组合:(坦白,坦白)不是帕累托最优
    • 社会最优策略组合:(抗拒,抗拒)
      国科大高级人工智能沈华伟2023,学校课程,# 高级人工智能,人工智能
  • 拍卖:
    • 首价:同时提交密封报价,选出价最高以出价购买;最优报价低于估价;人越多,报价越接近估价
      • 纳什均衡:每个竞拍者的报价低于其对商品的估价
    • 次价:同时提交密封报价,选出价最高以第二高出价购买
      • 纳什均衡:每个竞拍者会倾向于采用其对商品的估价进行报价
  • 讨价对象:双方对商品估值之差
  • maxmin、minmax策略:
    • Maxmin:最大化自己最坏情况下的利益
    • minmax:最小化对手最好情况下的利益
    • 零和博弈时收益对偶
  • 匹配市场:对于z: 7 5 2 - 5 2 0 = 2 3 0,3最大,选b
    国科大高级人工智能沈华伟2023,学校课程,# 高级人工智能,人工智能
  • 议价权
    • 稳定结局:未配对的边收益和>=1
      国科大高级人工智能沈华伟2023,学校课程,# 高级人工智能,人工智能
    • 纳什议价解:
      • 剩余价值:1-x-y
      • A收益=(1+x-y)/2
      • B收益=(1+y-x)/2
    • 均衡结局:任意配对边都满足
      国科大高级人工智能沈华伟2023,学校课程,# 高级人工智能,人工智能
    • 备选项:不与当前配对的话,能得到的最大收益

七、GNN卷积网络

  • spectral谱方法(数学方法)
    • 将图的拉普拉斯矩阵的特征向量作为基底,将样本投影到该空间后,进行卷积操作
    • 采用超参控制每次选择的相邻节点数量,对变化后的样本做 filter 和求加,再将输出结果进行拉普拉斯的逆变换,并输出非线性化后的结果
  • spatial空间方法(计算机方法)
    • 从CNN向GCN卷积的k迁移问题在于,需要确定一个固定的邻域,后续卷积的定序、参数共享步骤都可以在确定邻域后解决
  • 谱方法可以被定义为空间方法的一个子集
    • 相较于空间方法在原始空间定义聚合函数,谱方法在规范后实质上是对变换到新的空间中的样本进行卷积
    • 因此谱方法可以被看作是变换空间后的空间方法,其从属于空间方法这一类别。而谱方法将显式地写出了空间变换,空间方法直接将 kernel matrix 定义出来,未写明变换的空间

八、因果分析

d分离问题判断:
国科大高级人工智能沈华伟2023,学校课程,# 高级人工智能,人工智能

国科大高级人工智能沈华伟2023,学校课程,# 高级人工智能,人工智能

考试回忆

  • 选择题:
    • 人工智能三大分支
    • 图灵测试
    • 强化学习状态图选择蒙特卡洛方法
    • 囚徒困境帕累托最优
    • minmax和maxmin策略
    • 图神经网络
    • 最优匹配问题
    • 因果模型图判断d分离
  • 简答题:
    • 描述蚁群优化算法 or 粒子群优化算法(万年不变)
  • 应用题:
    • 格子游戏(万年不变)
      • 贝尔曼方程 + 策略提升 + 求解最优策略

国科大高级人工智能沈华伟2023,学校课程,# 高级人工智能,人工智能
国科大高级人工智能沈华伟2023,学校课程,# 高级人工智能,人工智能文章来源地址https://www.toymoban.com/news/detail-792092.html

到了这里,关于国科大《高级人工智能》沈老师部分——行为主义笔记的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 人工智能迷惑行为大赏

    把坚持当成一种习惯,别人光鲜的背后,都有加倍的付出,没有谁比谁更容易,只有谁比谁更努力! 在当今人工智能技术发展的浪潮下,越来越多的应用和平台开始推出自己的AI大模型,让我们似乎可以与人工智能进行更深入的互动和体验。例如,文心一言、通义千问等引人

    2024年03月13日
    浏览(40)
  • 人工智能与自主行为:理解与挑战

    人工智能(Artificial Intelligence,AI)是一门研究如何让计算机模拟人类智能的学科。自主行为(Autonomous Action)是一种能够在没有人类干预的情况下自主决策并执行的行为。人工智能与自主行为的结合,为我们提供了一种新的技术手段,可以让计算机自主地完成复杂的任务,甚至实现

    2024年02月19日
    浏览(46)
  • 抖音利用人工智能操控用户行为?商家、达人该乐了

    文|新熔财经 作者|一城 字节跳动早期投资人陈伟星在社交平台上狂喷抖音,引发不小的震动。 “运用人工智能对用户进行操控,引导其行为,最终实现抖音自身的意图目标”、“控制人类意识,沉迷于意识形态的皇帝之位”,这样的指控不可谓不尖锐。 事实上,早在漂亮

    2024年01月17日
    浏览(43)
  • 自主行为与环境适应的挑战:人工智能在能源领域的应用

    能源领域是人工智能(AI)的一个重要应用领域,因为能源系统具有复杂性、不确定性和实时性等特点。在过去的几年里,人工智能技术在能源领域取得了一定的进展,但仍然面临着许多挑战。这篇文章将从以下几个方面进行探讨: 背景介绍 核心概念与联系 核心算法原理和具体

    2024年02月22日
    浏览(40)
  • 高级人工智能之群体智能:粒子群算法

    粒子群优化算法(Particle Swarm Optimization, PSO)是一种基于群体协作和信息共享的优化技术。它由Kennedy和Eberhart于1995年提出,灵感来源于鸟群和鱼群的社会行为。PSO是解决连续空间优化问题的有效方法,特别适合于多峰和高维问题。以下是PSO的基本思想和工作原理: 1.1基本思想

    2024年01月18日
    浏览(38)
  • 【毕业设计选题】基于深度学习的学生课堂行为检测算法系统 YOLO python 卷积神经网络 人工智能

    目录 前言 设计思路 一、课题背景与意义 二、算法理论原理 2.1 深度卷积神经网络 2.2 YOLOv5算法 三、检测的实现 3.1 数据集 3.2 实验环境搭建 3.3 实验及结果分析 实现效果图样例 最后        📅大四是整个大学期间最忙碌的时光,一边要忙着备考或实习为毕业后面临的就业升学

    2024年02月19日
    浏览(103)
  • 【2022级研究生人工智能高级语言程序设计考试说明】

    考试题共包括4道大题: 第一大题:分类和回归----(7选1) 第二大题:降维和聚类----(6选1) 第三大题:API调用(课程中学习过的所有云平台)----(11选1) 第四大题:深度学习项目----(10选1) 题目采取随机分配方式,请查阅 人工智能高级语言程序设计考试-题目分配表 ,

    2024年02月11日
    浏览(53)
  • 密码学与人工智能的融合:如何实现更高级别的安全保障

    随着人工智能技术的不断发展,我们的生活、工作和社会都在不断变得更加智能化和自动化。然而,随着这种变革的推进,我们也面临着更多的安全挑战。密码学是一种数学性质的科学,它主要研究如何保护信息免受未经授权的访问和篡改。在这篇文章中,我们将探讨密码学

    2024年04月11日
    浏览(49)
  • Python编程入门基础及高级技能、Web开发、数据分析和机器学习与人工智能

    安装 Python 环境,选择一个 IDE,如 PyCharm、VSCode等。 安装 Python 环境是使用 Python 进行编程的第一步。Python 官网提供了 Windows、Linux 和 macOS 等主流操作系统的安装包,可以前往官网下载对应版本的 Python 并进行安装。 在安装完 Python 后,需要使用 pip 工具对常用的第三方库进行

    2024年02月09日
    浏览(65)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包