k-means算法例题应用

9月前作者：weixin_su 分类：Toy博客阅读(33) 违法举报

这篇具有很好参考价值的文章主要介绍了k-means算法例题应用。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

简单介绍：k-means 算法是一个聚类的算法。属于无监督学习算法，也是就样本没有label(标签)，然后根据某种规则进行“分割”，把相同的或者相近的放在一起。

算法缺点：不能帮助我们自动分类，需要指定。在很多实际应用当中，很难知道数据是什么分布的，应该分成几类比较好。这也是k-means自身的一个缺陷。

在这里K就是我们想要分割的的聚类的个数。

算法步骤：

先定义总共有多少个类/簇(cluster)
将每个簇心(cluster centers)随机定在一个点上
将每个数据点关联到最近簇中心所属的簇上
对于每一个簇找到其所有关联点的中心点（取每一个点坐标的平均值）
将上述点变为新的簇心
不停重复，直到每个簇所拥有的点不变

例题：

假设有如下8个点：(3,1),(3,2),(4,1),(4,2),(1,3),(1,4),(2,3),(2,4)。使用K-means算法对其进行聚类。设初始聚类中心分别为(0,4)和(3,3)。请写出详细的计算过程。
过程如下：
1 数据
数据集

X Y

A1 3 1

A2 3 2

A3 4 1

A4 4 2

A5 1 3

A6 1 4

A7 2 3

A8 2 4

2初始聚类中心分别为D1(0,4)和D2(3,3),计算各点到两中心的距离。

距离表1
	D1(0,4)	D2(3,3)
A1(3,1)	4.242	2 √
A2(3,2)	3.605	1 √
A3(4,1)	5	2.236 √
A4(4,2)	4.472	1.414 √
A5(1,3)	1.414 √	2
A6(1,4)	1 √	2.236
A7(2,3)	2.236	1 √
A8(2,4)	2	1.414 √

3根据上表分成两簇，{A1，A2，A3，A4，A7，A8}，{A5，A6}。重新计算新的聚类中心D3，D4。并计算新的距离表。
D3=（3+3+4+4+2+2）/6,(1+2+1+2+3+4)/6 = (3,2.167)
D4=（1+1）/2,(3+4)/2 = (1,3.5)

距离表2
	D3(3, 2.167)	D4(1,3.5)
A1(3,1)	1.167 √	3.201
A2(3,2)	0.167 √	2，5
A3(4,1)	1.536 √	3.905
A4(4,2)	1.013 √	3.354
A5(1,3)	2.166	0.5 √
A6(1,4)	2.712	0.5 √
A7(2,3)	1.301	1.118 √
A8(2,4)	2.088	1.118 √

4根据上表分成两簇，{A1，A2，A3，A4}，{A5，A6，A7，A8}。重新计算新的聚类中心D5，D6。并计算新的距离表。
D5=（3+3+4+4）/4,(1+2+1+2)/4 = (3.5,1.5)

D6=（1+1+2+2）/4,(3+4+3+4)/4 = (1.5,3.5)

距离表3
	D5(3.5,1.5)	D6(1.5,3.5)
A1(3,1)	0.707 √	2.915
A2(3,2)	0.707 √	2.121
A3(4,1)	0.707 √	3.535
A4(4,2)	0.707 √	2.915
A5(1,3)	2.915	0.707 √
A6(1,4)	3.535	0.707 √
A7(2,3)	2.121	0.707 √
A8(2,4)	2.915	0.707 √

5根据上表分成两簇，{A1，A2，A3，A4}，{A5，A6，A7，A8}，和步骤四分簇一致，停止计算。文章来源地址https://www.toymoban.com/news/detail-450974.html

到了这里，关于k-means算法例题应用的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

K-means算法

K-means算法是一种聚类算法，所谓聚类，即根据相似性原则，将具有较高相似度的数据对象划分至同一类簇，将具有较高相异度的数据对象划分至不同类簇。聚类与分类最大的区别在于，聚类过程为无监督过程，即待处理数据对象没有任何先验知识，而分类过程为有监督过程，

2024年02月09日
浏览(38)
k-means聚类算法详解

什么是特征向量？用来描述样本点的一组数据，要和我们数学中的向量区别一下，本质来说就是个数组，数组中的每个元素代表从不同角度描述样本点的值。 K-means 是我们最常用的基于欧式距离的聚类算法，其认为两个目标的距离越近，相似度越大。聚类就是对大量末知标

2024年02月16日
浏览(33)
【g】聚类算法之K-means算法

聚类算法是一种无监督学习方法，它将相似的数据样本划分为一组，同时将不相似的数据样本划分为另一组。这个过程由计算机自动完成，不需要任何人为的干预。 K-means算法是一种经典的聚类算法，它的主要思想是把数据集分成k个簇，每个簇包括距离其它各簇最近的若干个

2024年02月08日
浏览(39)
无涯教程-聚类算法 - K-Means

K-均值聚类算法计算质心并进行迭代，直到找到最佳质心为止，它假定群集的数目是已知的，它也称为扁平聚类算法。通过算法从数据中识别出的簇数以K均值中的\\\" K\\\"表示。在该算法中，将数据点分配给群集，以使数据点和质心之间的平方距离之和最小。应当理解，簇内的较

2024年02月10日
浏览(45)
K-means算法（知识点梳理）

目录一.K-means算法的原理和工作流程 1.算法原理 2.工作流程二.K-means中常用的距离度量方法 1.欧几里得距离（欧氏距离） 2.曼哈顿距离 3.切比雪夫距离三.K-means算法中K值的选择 1.手肘法 2. 轮廓系数手肘法和轮廓系数的实现四.初始点的选择 1.随机选择 2.最远距离

2024年02月16日
浏览(43)
【机器学习】十大算法之一 “K-means”

作者主页：爱笑的男孩。的博客_CSDN博客-深度学习,活动,python领域博主爱笑的男孩。擅长深度学习,活动,python,等方面的知识,爱笑的男孩。关注算法,python,计算机视觉,图像处理,深度学习,pytorch,神经网络,opencv领域. https://blog.csdn.net/Code_and516?type=blog 个人简介：打工人。持续分

2024年02月10日
浏览(46)
K-means++聚类算法（matlab实现）

K-means++算法：K-means++算法是K-means算法的改进版，其在选择初始质心时采用了一种更加聪明的方法，能够有效地避免局部最优解。具体来说，K-means++算法的初始质心是根据距离数据点最远的原则来选择的，这样可以保证初始质心的分布更加广泛，从而使得算法更容易找到全局最

2024年02月07日
浏览(97)
K-means聚类算法原理及实现

1.1概念聚类分析，也称为分割分析或分类分析，可将样本数据分成一个个组（即簇）。同一簇中的对象是相似的，不同簇中的对象则明显不同。 Statistics and Machine Learning Toolbox™ 提供了几种聚类方法和相似性度量（也称为距离度量）来创建簇。此外，簇计算可以按照不同的计

2024年03月18日
浏览(41)
机器学习之K-means聚类算法

目录 K-means聚类算法算法流程优点缺点随机点聚类人脸聚类旋转物体聚类 K-means聚类算法是一种无监督的学习方法，通过对样本数据进行分组来发现数据内在的结构。K-means的基本思想是将n个实例分成k个簇，使得同一簇内数据相似度高而不同簇之间数据相似度低。 K-means的

2024年02月11日
浏览(42)
机器学习之K-Means（k均值）算法

K-Means算法又称K均值算法，属于聚类（clustering）算法的一种，是应用最广泛的聚类算法之一。所谓聚类，即根据相似性原则，将具有较高相似度的数据对象划分至同一类簇，将具有较高相异度的数据对象划分至不同类簇。聚类与分类最大的区别在于，聚类过程为无监督过程，

2024年02月03日
浏览(42)