【人工智能:现代方法】第19章:样例学习

这篇具有很好参考价值的文章主要介绍了【人工智能:现代方法】第19章:样例学习。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

  • 智能体学习(learning):一个智能体通过对世界进行观测来提高它的性能
  • 机器学习(machine learning):智能体是一台计算机 —— 一台计算机观测到一些数据,基于这些数据构建一个模型(model),并将这个模型作为关于世界的一个假设(hypothesis)以及用于求解问题的软件的一部分

为什么希望一台机器进行学习?

  • 程序的设计者无法预见未来所有可能发生的情形
  • 有时候设计者并不知道如何设计一个程序来求解目标问题——大多数人都能辨认自己家人的面孔,但是他们实现这一点利用的是潜意识

1 学习的形式

  • 归纳(induction):从一组特定的观测结果得出一个普遍的规则—— 归纳的结论可能是不正确【只要前提是正确的,演绎(deduction)的结论就保证是正确的】
  • 分类(classification):输出是一个有限集合中的某个值时
  • 回归(regression):输出是一个数值

根据输入有3种类型的反馈(feedback),学习可分为3类:

  • 监督学习(supervised learning):智能体观测到输入-输出对,并学习从输入到输出的一个函数映射 —— 输出称之为标签(label)
  • 无监督学习(unsupervised learning):智能体从没有任何显式反馈输入中学习模式;最常见的无监督学习任务是聚类(clustering)
  • 强化学习(reinforcement learning)中:智能体从一系列的强化——奖励与惩罚——中进行学习,智能体判断之前采取的哪个动作该为这一结果负责,并且改变它的动作以在未来得到更多的奖励

2 监督学习

监督学习的任务

  • 给定一个训练集(training set)含有N个“输入-输出”对样例: ( x 1 , y 1 ) , ( x 2 , y 2 ) , ( x 3 , y 3 ) , . . . , ( x N , y N ) (x_1,y_1),(x_2,y_2),(x_3,y_3),...,(x_N,y_N) (x1,y1),(x2,y2),(x3,y3),...,(xN,yN)
  • 每一对数据都由一个未知的函数 y = f ( x ) y=f(x) y=f(x)生成
  • 目标:寻找一个函数 h h h近似真实的函数 f f f

  • 函数 h h h :关于世界的假设(hypothesis),取自一个包含所有可能的函数 假设空间(hypothesis space) H \mathcal{H} H【其他说法,模型-模型类,函数-函数类
  • 输出 y i y_i yi:真实数据(ground truth)

如何选择一个假设空间

  • 关于数据生成过程的先验知识【如果有的话】
  • 采用探索性数据分析(exploratory data analysis):通过统计检验和可视化方法——直方图、散点图、箱形图——来探索数据以获得对数据的一些理解,以及洞察哪些假设空间可能是合适的
  • 直接尝试多种不同的假设空间,然后评估哪个假设空间的效果最好

如何从假设空间中选择一个好的假设

  • 寻找一个一致性假设(consistent hypothesis):假设 h h h ,对训练集中的任意一个 x i x_i xi,都有 h ( x i ) = y i h(x_i) = yi h(xi)=yi
  • 如果输出是连续值,不能期望模型输出与真实数据精确匹配,而是寻找一个最佳拟合函数(best-fit function),使得每一个 h ( x i ) h(x_i) h(xi) y i y_i yi非常接近
  • 衡量一个假设的标准不是看它在训练集上的表现,而是取决于它如何处理尚未观测到的输入:使用一个测试集(test set)—— 如果 h h h 准确地预测了测试集的输出,称 h h h 具有很好的泛化(generalize)能力

如何分析假设空间:

  • 偏差(bias):(不严格地)在不同的训练集上,假设所预测的值偏离期望值的平均趋势
    • 常常是由假设空间所施加的约束造成的,如假设空间是线性函数时会导致较大的偏差,分段线性函数具有较小的偏差
    • 欠拟合(underfitting):一个假设不能找到数据中的模式
  • 方差(variance):由训练数据波动而导致假设的变化量
    • 过拟合(overfitting):一个函数过于关注它用来训练的特定训练数据集,进而导致它在没有见过的数据上表现较差
  • 偏差-方差权衡(bias-variance tradeoff):在更复杂、低偏差的能较好拟合训练集的假设与更简单、低方差的可能泛化得更好的假设中做出选择
  • 奥卡姆剃刀原则(Ockham’s razor):如无必要,勿增实体

表达能力与复杂性的权衡

  • 表达性语言使简单的假设能够与数据相匹配
  • 限制语言的表达能力则意味着任何一致性假设都必定是复杂的

3 决策树学习

决策树(decision tree):将属性值向量映射到单个输出值(即“决策”)的函数

  • 决策树通过执行一系列测试来实现其决策:从根节点出发,沿着适当的分支,直到到达叶节点为止
  • 树中的每个内部节点对应于一个输入属性的测试,该节点的分支用该属性的所有可能值进行标记,叶节点指定了函数要返回的值
    【人工智能:现代方法】第19章:样例学习,AI基础,人工智能,学习

3.1 决策树的表达能力

  • 命题逻辑中的任何函数都可以表示为决策树

一棵布尔型的决策树的逻辑语句:

  • O u t p u t ⇔ ( P a t h 1 ∨ P a t h 2 ∨ … ) Output \Leftrightarrow (Path_1 \vee Path_2 \vee …) OutputPath1Path2

  • P a t h i Path_i Pathi:根节点到true叶节点的路径上的属性-值测试形式 A m = v x ∧ A n = v y ∧ … ) A_m = v_x \wedge A_n = v_y \wedge …) Am=vxAn=vy的合取

  • 所有的决策树将空间分割为矩形,即与坐标轴平行的方框

  • 不存在一种表示方式使得任何函数都能被有效地表示

最重要的属性:对一个样例的分类结果能产生最大影响的属性文章来源地址https://www.toymoban.com/news/detail-815575.html

到了这里,关于【人工智能:现代方法】第19章:样例学习的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 自媒体人的日常ai写作神器:9款超级实用的工具分享! #人工智能#媒体#学习方法

    我们做自媒体运营,想要快速的创作内容,提供文章的创作速度是我们的目标,我们别的大佬可以很快地就创作出一篇内容,而自己墨迹半天确出不了一个字呢?其实这关乎到创作技巧,下面小编就跟大家分享如何利用自媒体工具辅助自己创作的技巧。 1.七燕写作 这是一个微

    2024年04月22日
    浏览(50)
  • 如何学习人工智能AI技术

    目录 1.基础知识准备 2.软件环境 3.理论学习  4.常见人工智能技术 5.样本库 5.1 图像识别与计算机视觉 5.2自然语言处理 5.3语音识别与合成 5.4其他领域 6.算力        学习人工智能是一项系统性的任务,涉及到理论知识、编程技能、算法理解、项目实践等多个层面。下面是一个

    2024年04月29日
    浏览(65)
  • Stable Diffusion现代人工智能艺术成功背后的物理学原理,破译用于文本到图像生成的著名 AI 模型与物理学中观察到的过程之间的联系

    毫不奇怪地否认本文的许多内容是使用人工智能生成的,当然包括描绘当今数字艺术最大趋势之一的图像。 虽然最近几天迅速传播并融入我们对话中的一些最新语言模型不一定适合图像生成,但本文旨在关注文本到图像 AI,特别是著名的系统“稳定扩散” ”。创意工具市场

    2024年02月11日
    浏览(67)
  • 人工智能该如何学习?详细的AI学习

    英杰社区 https://bbs.csdn.net/topics/617804998        OpenAI最近发布了一款名为ChatGPT的聊天机器人模型,它受到了广泛的关注和赞誉。ChatGPT以一种更贴近人类对话方式进行交互,可以回答问题、承认错误、挑战不正确的前提、拒绝不适当的请求等。它提供高质量的回答,并且与用

    2024年02月08日
    浏览(60)
  • 创新释放:Atlassian 人工智能引领现代工作

    随着人工智能技术的蓬勃发展, 越来越多企业开始关注将 AI 技术应用于业务 。作为一家备受瞩目的协作软件工具提供商, Atlassian 积极探索并应用人工智能技术 。 在人类历史上, 团队一直是最伟大成就的核心 。Atlassian 的使命在于 释放每个团队的潜力 ,协助他们 完成单独

    2024年02月03日
    浏览(78)
  • 【AI】了解人工智能、机器学习、神经网络、深度学习

    一、深度学习、神经网络的原理是什么? 深度学习和神经网络都是基于对人脑神经系统的模拟。下面将分别解释深度学习和神经网络的原理。 深度学习的原理: 深度学习是一种特殊的机器学习,其模型结构更为复杂,通常包括很多隐藏层。它依赖于神经网络进行模型训练和

    2024年02月06日
    浏览(79)
  • AI人工智能 机器学习 深度学习 学习路径及推荐书籍

    人工智能、机器学习和深度学习覆盖的技术范畴是逐层递减的,三者的关系:人工智能 机器学习 深度学习。 人工智能(ArtificialIntelligence,AI)是最宽泛的概念,是研发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学 机器学习(MachineLear

    2023年04月24日
    浏览(66)
  • 走进人工智能|强化学习 AI发展的未来引擎

    前言: 强化学习是一种通过智能体与环境交互,通过尝试最大化累计奖励来学习最优行为策略的机器学习方法。 本篇带你走进强化学习!一起来学习了解吧!!! 强化学习是一种机器学习方法,旨在通过试错来学习正确的行为。与其他机器学习方法不同,强化学习的主要目

    2024年02月10日
    浏览(83)
  • AI人工智能预处理数据的方法和技术有哪些?

    在人工智能(Artificial Intelligence,简称AI)领域中,数据预处理是非常重要的一环。它是在将数据输入到模型之前对数据进行处理和清洗的过程。数据预处理可以提高模型的准确性、可靠性和可解释性。 本文将详细介绍AI人工智能预处理数据的方法和技术。 数据清洗是数据预

    2024年02月14日
    浏览(59)
  • AI学术交流——“人工智能”和“神经网络学习”

    作者简介:一名云计算网络运维人员、每天分享网络与运维的技术与干货。   座右铭:低头赶路,敬事如仪 个人主页:网络豆的主页​​​​​ 目录 前言 一.人工智能 1.“人工智能之父” 2.达特茅斯会议(人工智能起源) 3.人工智能重要节点 二.神经网络 1.什么是神经网络

    2024年02月09日
    浏览(62)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包