摘要: 本贴描述分类、回归、聚类问题的基本概念.
1. 基本概念
机器学习常识 2: 数据类型从输入数据的角度来进行讨论, 这里从输出数据, 或者目标的角度来讨论.
分类是指将一个样本预测为给定类别之一. 也称为该样本打标签.
-
例 1: 如果我去向那个女生表白, 她会同意吗? (Y/N)
由于可能的类别只有两种, 这被称为二分类问题. -
例 2: 哪个国家会夺得下届奥运会团体射击冠军? (中国队/美国队/法国队/…)
由于可能的类别有多种, 这被称为多分类问题.
回归是指为一个输出为实型值的预测.
- 例 3: 根据一张照片判断人的年龄. (
[
0
,
100
]
[0, 100]
[0,100])
由于人的年龄是实型 (虽然这里是整型, 但它的值可以比较大小, 也可以当成实型对待) - 例 4: 根据某只股票这段时间的价格波动, 判断明天的涨/跌. (
[
−
10
%
,
+
10
%
]
[-10\%, +10\%]
[−10%,+10%])
由于它的输入数据是前面若干天的数据, 而不是当天的数据, 这被称为时序回归问题.
聚类是指根据样本的属性, 把给定的样本集合划分为若干个子集.
- 例 5: 把一大堆照片分成若干小堆. 如果能够获得关于这个划分良好的解释更好.
聚类与分类 (回归) 之间存在本质的区别, 它不进行新样本的预测. 这是迫不得已的事情, 因为很多数据并没有人类先给的标签, 导致缺乏一个确定的目标, 机器只有根据自己理解来划分.文章来源:https://www.toymoban.com/news/detail-456608.html
2. 扩展概念
多标签分类是指类别之间没有互斥性.文章来源地址https://www.toymoban.com/news/detail-456608.html
- 例 6: 明天的天气如何? (有雨/无雨, 有风/无风, 有太阳/无太阳, …) 明天可以既刮风又下雨, 甚至边下雨边出太阳.
- 例 7: 图片中有哪些动物? (猫, 狗, 老鼠)
到了这里,关于机器学习常识 3: 分类、回归、聚类的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!