机器学习---定义、用途、算法的分类、假设空间与归纳偏好、奥卡姆剃刀原则

这篇具有很好参考价值的文章主要介绍了机器学习---定义、用途、算法的分类、假设空间与归纳偏好、奥卡姆剃刀原则。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

1. 机器学习的定义

基于历史经验的,描述和预测的理论、方法和算法。

从历史数据中,发现某些模式或规律(描述),利用发现的模式和规律进行预测。

2. 机器学习能做什么

机器学习已经有了十分广泛的应用,例如:数据挖掘、计算机视觉、自然语言处理、生物特征识

别、搜索引擎、医学诊断、检测信用卡欺诈、证券市场分析、DNA序列测序、语音和手写识别、战

略游戏和机器人运用。

机器学习方法在大型数据库中的应用被称为数据挖掘(Data Mining)。

大量的金属氧化物以及原料从矿山开采出来,处理后产生少量的珍贵物质。数据挖掘中,需要处理

大量的数据以构建简单有用的模型,例如高精度的预测模型。

机器学习还可以解决视觉、语音识别以及机器人方面的许多问题。

通过分析一个人脸部图像的多个样本,学习程序可以捕获到那个人特有的模式。然后进行辨认。

3. 机器学习算法的分类

机器学习---定义、用途、算法的分类、假设空间与归纳偏好、奥卡姆剃刀原则,机器学习,机器学习,人工智能

监督学习:数据集中的每个样本有相应的正确答案。

比如:在婴儿的大脑中,可以将大脑看为模型。

机器学习---定义、用途、算法的分类、假设空间与归纳偏好、奥卡姆剃刀原则,机器学习,机器学习,人工智能

 监督学习算法图示:

机器学习---定义、用途、算法的分类、假设空间与归纳偏好、奥卡姆剃刀原则,机器学习,机器学习,人工智能

机器学习---定义、用途、算法的分类、假设空间与归纳偏好、奥卡姆剃刀原则,机器学习,机器学习,人工智能

分类和回归的区别在于输出变量的类型。

定量输出称为回归,或者说是连续变量预测;

定性输出称为分类,或者说是离散变量预测。

比如:预测明天的气温是多少度,这是一个回归任务;

预测明天是阴、晴还是雨,这是一个分类任务;

预测人脸、鼻子、眼睛坐标位置;这是一个回归任务;

预测这是谁的人脸?是小明的脸吗?这是一个分类任务;

预测这张图是猫?狗?牛?鸟?这是一个分类任务;

预测这张图是猫的概率?这是一个回归任务。

无监督学习图示:

机器学习---定义、用途、算法的分类、假设空间与归纳偏好、奥卡姆剃刀原则,机器学习,机器学习,人工智能

比如:Google News搜集网上的新闻,并且根据新闻的主题将新闻分成许多簇, 然后将在同一个簇

的新闻放在一起。

对于一组不同的人我们测量他们DNA中对于一个特定基因的表达程度。然后根据测量结果可以用聚

类算法将他们分成不同的类型。这就是一种无监督学习, 因为我们只是给定了一些数据,而并不知

道哪些是第一种类型的人,哪些是第二种类型的人等等。

4. 机器学习过程

机器学习---定义、用途、算法的分类、假设空间与归纳偏好、奥卡姆剃刀原则,机器学习,机器学习,人工智能

 预处理的过程:

机器学习---定义、用途、算法的分类、假设空间与归纳偏好、奥卡姆剃刀原则,机器学习,机器学习,人工智能

 可能需要用多多种算法,算法融合的过程:

机器学习---定义、用途、算法的分类、假设空间与归纳偏好、奥卡姆剃刀原则,机器学习,机器学习,人工智能

5. 假设空间与归纳偏好

假设空间是指所有可能的能满足样本输入和输出的假设函数h(x)的集合。假设函数一定是一个无穷

大的集合。也就是说,如果样本是一串有穷的离散点(xi,yi),i属于1到N,那么能够拟合这这些

点的无穷多个函数都是可能的假设函数。

归纳偏好是一个能挑选最佳假设函数的基准。

以韦小宝的7个老婆为例,这7个老婆均满足小宝的要求,因此构成了大小为7的假设空间。(实际

上,假设空间的大小一定是无穷大的。为了说明问题,我们暂时以7为大小)。那么,如何衡量哪

一个假设空间中哪一个假设函数(老婆)最好呢?如果以温柔体贴为偏好来选,当然是小双;如果

以小宝的迷恋为偏好来讲,假设函数就是阿珂。

一般情况下,我们都使用“奥卡姆剃刀”原则,也就是选择最简单的假设函数。也就是变量最少,变

量的幂指数最小的函数。也就是说,一次函数能拟合时就不选二次函数作为假设函数。

奥卡姆剃刀原理(Ockham's Razor)是由14的世纪哲学家、圣方济各会修士奥卡姆的威廉

(William of Occam,约1285年至1349年)提出的一个原理。这个原理是告诫人们“切勿浪费较多

东西去做用较少的东西同样可以做好的事情。”后来以一种更为广泛的形式为人们所知,即“如无必

要,勿增实体。”

当你有两个处于竞争地位的理论能得出同样的结论,那么简单的那个更好。如果你有两个原理,它

们都能解释观测到的事实,那么你应该使用简单的那个,直到发现更多的证据。对于现象最简单的

解释往往比较复杂的解释更正确。如果你有两个类似的解决方案,选择最简单的。需要最少假设的

解释最有可能是正确的。或者以这种自我肯定的形式出现:让事情保持简单。文章来源地址https://www.toymoban.com/news/detail-562848.html

到了这里,关于机器学习---定义、用途、算法的分类、假设空间与归纳偏好、奥卡姆剃刀原则的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 机器学习分类算法之XGBoost(集成学习算法)

    目录 走进XGBoost 什么是XGBoost? XGBoost树的定义 XGBoost核心算法 正则项:树的复杂程度 XGBoost与GBDT有什么不同 XGBoost需要注意的点 XGBoost重要参数详解 调参步骤及思想 XGBoost代码案例 相关性分析 n_estimators(学习曲线) max_depth(学习曲线) 调整max_depth 和min_child_weight 调整gamma 调

    2024年02月03日
    浏览(54)
  • 机器学习基本算法:算法流程和算法分类

    1、算法流程           机器学习的过程是一个完整的项目周期,其中包括数据的采集、数据的特征提取与分类,之后采用何种算法去创建机器学习模型从而获得预测数据。 算法流程 从上图可以看出一个完整的机器学习项目包含以下这些内容: 输入数据:通过自然采集的数

    2024年01月22日
    浏览(54)
  • 机器学习笔记 - 基于自定义数据集 + 3D CNN进行视频分类

            这里主要介绍了基于自定义动作识别数据集训练用于视频分类的 3D 卷积神经网络 (CNN) 。3D CNN 使用三维滤波器来执行卷积。内核能够在三个方向上滑动,而在 2D CNN 中它可以在二维上滑动。         这里的模型主要基于D. Tran 等人2017年的论文“动作识别的时空卷积研

    2024年01月23日
    浏览(48)
  • 机器学习算法分类

    机器学习根据任务的不同,可以分为监督学习、无监督学习、半监督学习、强化学习。  1. 无监督学习 训练数据不包含任何类别信息。无监督学习里典型例子是聚类。要解决的问题是聚类问题和降维问题, 聚类算法 利用样本的特征,将具有相似特征的样本划分到同一类别中

    2024年02月16日
    浏览(34)
  • 机器学习——基于朴素贝叶斯分类算法实现垃圾邮件分类

    贝叶斯定理: 贝叶斯理论指的是,根据一个已发生事件的概率,计算另一个事件的发生概率。贝叶斯理论从数学上的表示可以写成这样:  ,在这里A和B都是事件, P(B)P(B)不为0。 在贝叶斯定理中: 1. P(A) 称为”先验概率”,即在B事件发生之前,我们对A事件概率的一个判断。如

    2024年02月04日
    浏览(51)
  • [机器学习]分类算法系列①:初识概念

    目录 1、概念 2、数据集介绍与划分 2.1、数据集的划分 2.2、sklearn数据集介绍 2.2.1、API 2.2.2、分类和回归数据集 分类数据集 回归数据集 返回类型 3、sklearn转换器和估计器 3.1、转换器 三种方法的区别 3.2、估计器 3.2.1、简介 3.2.2、API 3.3、工作流程 整个系列中总共需要掌握的内

    2024年02月10日
    浏览(38)
  • 《机器学习核心技术》分类算法 - 决策树

    「作者主页」: 士别三日wyx 「作者简介」: CSDN top100、阿里云博客专家、华为云享专家、网络安全领域优质创作者 「推荐专栏」: 小白零基础《Python入门到精通》 决策树是一种 「二叉树形式」 的预测模型,每个 「节点」 对应一个 「判断条件」 , 「满足」 上一个条件才

    2024年02月11日
    浏览(54)
  • 机器学习KNN最邻近分类算法

    KNN (K-Nearest Neighbor) 最邻近分类算法,其核心思想“近朱者赤,近墨者黑”,由你的邻居来推断你的类别。 图中绿色圆归为哪一类? 1、如果k=3,绿色圆归为红色三角形 2、如果k=5,绿色圆归为蓝色正方形 参考文章 knn算法实现原理:为判断未知样本数据的类别,以所有已知样

    2024年04月10日
    浏览(65)
  • 机器学习——kNN算法之红酒分类

    目录 StandardScaler的使用 KNeighborsClassifier的使用 代码实现 数据集介绍 数据集为一份红酒数据,总共有 178 个样本,每个样本有 13 个特征,这里不会为你提供红酒的标签,你需要自己根据这 13 个特征对红酒进行分类。部分数据如下图: StandardScaler的使用 由于数据中有些特征的

    2024年02月11日
    浏览(36)
  • 大数据机器学习与深度学习——过拟合、欠拟合及机器学习算法分类

    针对模型的拟合,这里引入两个概念:过拟合,欠拟合。 过拟合:在机器学习任务中,我们通常将数据集分为两部分:训练集和测试集。训练集用于训练模型,而测试集则用于评估模型在未见过数据上的性能。过拟合就是指模型在训练集上表现较好,但在测试集上表现较差的

    2024年02月04日
    浏览(42)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包