机器学习期中考试

这篇具有很好参考价值的文章主要介绍了机器学习期中考试。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

1、使用KNN算法对两个未知类型的样本进行分类(冰川水或者湖泊水),其中K=3,即选择最近的3个邻居。(20分)
机器学习期中考试,机器学习,人工智能

学生答案:
解:
D i s t a n c e ( G , A ) 2 = 0.1 ; D i s t a n c e ( G , B ) 2 = 0.03 ; D i s t a n c e ( G , C ) 2 = 0.11 Distance(G,A)^2=0.1; Distance(G,B)^2=0.03; Distance(G,C)^2=0.11 Distance(G,A)2=0.1;Distance(G,B)2=0.03;Distance(G,C)2=0.11
D i s t a n c e ( G , D ) 2 = 0.12 ; D i s t a n c e ( G , E ) 2 = 0.16 ; D i s t a n c e ( G , F ) 2 = 0.05 Distance(G,D)^2=0.12; Distance(G,E)^2=0.16; Distance(G,F)^2=0.05 Distance(G,D)2=0.12;Distance(G,E)2=0.16;Distance(G,F)2=0.05
G的三个最近的邻居为B,F,A,因此G的分类为冰川水
D i s t a n c e ( H , A ) 2 = 0.03 ; D i s t a n c e ( H , B ) 2 = 0.18 ; D i s t a n c e ( H , C ) 2 = 0.22 Distance(H,A)^2=0.03; Distance(H,B)^2=0.18; Distance(H,C)^2=0.22 Distance(H,A)2=0.03;Distance(H,B)2=0.18;Distance(H,C)2=0.22
D i s t a n c e ( H , D ) 2 = 0.03 ; D i s t a n c e ( H , E ) 2 = 0.21 ; D i s t a n c e ( H , F ) 2 = 0.16 Distance(H,D)^2=0.03; Distance(H,E)^2=0.21; Distance(H,F)^2=0.16 Distance(H,D)2=0.03;Distance(H,E)2=0.21;Distance(H,F)2=0.16
H的三个最近的邻居为A,D,F,因此H的分类为湖泊水
2、使用CART决策树算法对两个未知类型的样本进行分类。(使用ID3决策树算法对两个未知类型的样本进行分类。)(20分)
机器学习期中考试,机器学习,人工智能

CART算法:
对样本集S,计算其在各个属性划分上的基尼指数。
1)
G i n i ( S , C a + 浓度 ) = 4 / 8 [ 1 − ( 2 / 4 ) 2 − ( 2 / 4 ) 2 ] + 4 / 8 [ 1 − ( 2 / 4 ) 2 − ( 2 / 4 ) 2 ] = 0.5 Gini(S,Ca+浓度)=4/8 [1-(2/4)^2-(2/4)^2 ]+4/8 [1-(2/4)^2-(2/4)^2 ] = 0.5 Gini(S,Ca+浓度)=4/8[1(2/4)2(2/4)2]+4/8[1(2/4)2(2/4)2]=0.5
2)
G i n i ( S , M g + 浓度 ) = 4 / 8 [ 1 − ( 3 / 4 ) 2 − ( 1 / 4 ) 2 ] + 4 / 8 [ 1 − ( 1 / 4 ) 2 − ( 3 / 4 ) 2 ] = 0.375 Gini(S,Mg+浓度)=4/8 [1-(3/4)^2-(1/4)^2 ]+4/8 [1-(1/4)^2-(3/4)^2 ] = 0.375 Gini(S,Mg+浓度)=4/8[1(3/4)2(1/4)2]+4/8[1(1/4)2(3/4)2]=0.375
3)
G i n i ( S , N a + 浓度 ) = 4 / 8 [ 1 − ( 2 / 4 ) 2 − ( 2 / 4 ) 2 ] + 4 / 8 [ 1 − ( 2 / 4 ) 2 − ( 2 / 4 ) 2 ] = 0.5 Gini(S,Na+浓度)=4/8 [1-(2/4)^2-(2/4)^2 ]+4/8 [1-(2/4)^2-(2/4)^2 ] = 0.5 Gini(S,Na+浓度)=4/8[1(2/4)2(2/4)2]+4/8[1(2/4)2(2/4)2]=0.5
4)
G i n i ( S , C l − 浓度 ) = 4 / 8 [ 1 − ( 2 / 4 ) 2 − ( 2 / 4 ) 2 ] + 4 / 8 [ 1 − ( 4 / 4 ) 2 ] = 0.25 Gini(S,Cl-浓度)=4/8 [1-(2/4)^2-(2/4)^2 ]+4/8 [1-(4/4)^2 ] = 0.25 Gini(S,Cl浓度)=4/8[1(2/4)2(2/4)2]+4/8[1(4/4)2]=0.25
Cl-浓度属性的基尼指数最小,将Cl-浓度属性作为第一个划分属性,将集合S划分为以下两个子集:
S1(高):
机器学习期中考试,机器学习,人工智能

S2(低):
机器学习期中考试,机器学习,人工智能

对样本集S1,所有样本均属于同一类型:冰川水。
对样本集S2,计算其在各个属性划分上的基尼指数:
1)
G i n i ( S 2 , C a + 浓度 ) = 2 / 6 [ 1 − ( 1 / 2 ) 2 − ( 1 / 2 ) 2 ] + 4 / 6 [ 1 − ( 2 / 4 ) 2 − ( 2 / 4 ) 2 ] = 0.5 Gini(S2,Ca+浓度)=2/6 [1-(1/2)^2-(1/2)^2 ]+4/6 [1-(2/4)^2-(2/4)^2 ] = 0.5 Gini(S2,Ca+浓度)=2/6[1(1/2)2(1/2)2]+4/6[1(2/4)2(2/4)2]=0.5
2)
G i n i ( S 2 , M g + 浓度 ) = 2 / 6 [ 1 − ( 2 / 2 ) 2 ] + 4 / 6 [ 1 − ( 3 / 4 ) 2 − ( 1 / 4 ) 2 ] = 0.25 Gini(S2,Mg+浓度)=2/6 [1-(2/2)^2 ]+4/6 [1-(3/4)^2-(1/4)^2 ] =0.25 Gini(S2,Mg+浓度)=2/6[1(2/2)2]+4/6[1(3/4)2(1/4)2]=0.25
3)
G i n i ( S 2 , N a + 浓度 ) = 2 / 6 [ 1 − ( 2 / 2 ) 2 ] + 4 / 6 [ 1 − ( 2 / 4 ) 2 − ( 2 / 4 ) 2 ] = 0.333 Gini(S2,Na+浓度)=2/6 [1-(2/2)^2 ]+4/6 [1-(2/4)^2-(2/4)^2 ] =0.333 Gini(S2,Na+浓度)=2/6[1(2/2)2]+4/6[1(2/4)2(2/4)2]=0.333
可以看出Gini(S2,Mg+浓度)最小,所以应该选择Mg+浓度属性作为测试属性。
Mg+浓度属性将样本集划分为两个子集:
1)S21
机器学习期中考试,机器学习,人工智能

2)S22
机器学习期中考试,机器学习,人工智能

对样本集S21,计算其在各个属性划分上的基尼指数:
1)
G i n i ( S 21 , C a + 浓度 ) = 2 / 3 [ 1 − ( 1 / 2 ) 2 − ( 1 / 2 ) 2 ] + 1 / 3 [ 1 − ( 1 / 1 ) 2 ] = 0.333 Gini(S21,Ca+浓度)=2/3 [1-(1/2)^2-(1/2)^2 ]+1/3 [1-(1/1)^2 ] =0.333 Gini(S21,Ca+浓度)=2/3[1(1/2)2(1/2)2]+1/3[1(1/1)2]=0.333
2)
G i n i ( S 21 , N a + 浓度 ) = 2 / 3 [ 1 − ( 2 / 2 ) 2 ] + 1 / 3 [ 1 − ( 1 / 1 ) 2 ] = 0 Gini(S21,Na+浓度)=2/3 [1-(2/2)^2 ]+1/3 [1-(1/1)^2 ] =0 Gini(S21,Na+浓度)=2/3[1(2/2)2]+1/3[1(1/1)2]=0
可以看出Gini(S2,Na+浓度)最小,所以应该选择Na+浓度浓度属性作为测试属性。
Na+浓度属性将样本集划分为两个子集, 并且各个子集中的样本都属于同一个类型。

对样本集S22,所有样本均属于同一类型湖泊水。
决策树构造完毕,如下图所示。
机器学习期中考试,机器学习,人工智能

图1 选择Na+浓度作为节点
由上面决策树,得第一个待识别样本类型为湖泊水;第二个待识别样本类型为冰川水。
3、如下表所示的数据集,其在二维空间中的分布情况如图1所示,用户输入ε=1,MinPts=5,采用DBSCAN算法对表中数据进行聚类。(20分)
机器学习期中考试,机器学习,人工智能
机器学习期中考试,机器学习,人工智能

第一类:{1,3,4,5,10}
第二类:{2,6,7,8,11}

4、已知数据集如表1所示,使用朴素Bayes算法预测气候状况为雨天,高温,湿度中等。微风时,是否适合户外运动?(20分)
表1 数据集信息
机器学习期中考试,机器学习,人工智能

解:
即求X={下雨,高,中等,威风}的户外运动为可以的后验概率P(Y=y|X)和为不可以的后验概率P(Y=n|X)两者值中较大者为X的预测值。
根据Bayes定理,
P ( Y = y ∣ X ) = P ( X ∣ Y = y ) ∗ P ( Y = y ) = P ( x 1 ∣ Y = y ) ∗ P ( x 2 ∣ Y = y ) ∗ P ( x 3 ∣ Y = y ) ∗ P ( x 4 ∣ Y = y ) ∗ P ( Y = y ) P(Y=y|X)\\= P(X|Y=y)*P(Y=y) \\= P(x_1|Y=y)* P(x_2|Y=y)* P(x_3|Y=y)* P(x_4|Y=y)*P(Y=y) P(Y=yX)=P(XY=y)P(Y=y)=P(x1Y=y)P(x2Y=y)P(x3Y=y)P(x4Y=y)P(Y=y)
这里, P ( x 1 ∣ Y = y ) = P ( x 1 = 下雨 ∣ Y = y ) = 3 / 6 P(x_1|Y=y)= P(x_1=下雨|Y=y)=3/6 P(x1Y=y)=P(x1=下雨Y=y)=3/6
P ( x 2 ∣ Y = y ) = P ( x 2 = 高 ∣ Y = y ) = 1 / 6 P(x_2|Y=y)= P(x_2=高|Y=y)=1/6 P(x2Y=y)=P(x2=Y=y)=1/6
P ( x 3 ∣ Y = y ) = P ( x 3 = 中等 ∣ Y = y ) = 4 / 6 P(x_3|Y=y)= P(x_3=中等|Y=y)=4/6 P(x3Y=y)=P(x3=中等Y=y)=4/6
P ( x 4 ∣ Y = y ) = P ( x 4 = 微风 ∣ Y = y ) = 5 / 6 P(x_4|Y=y)= P(x_4=微风|Y=y)=5/6 P(x4Y=y)=P(x4=微风Y=y)=5/6
$P(Y=y)= 6/10 $
因此, P ( Y = y ∣ X ) = 3 / 6 ∗ 1 / 6 ∗ 4 / 6 ∗ 5 / 6 ∗ 6 / 10 = 1 / 36 P(Y=y|X)= 3/6*1/6*4/6*5/6*6/10=1/36 P(Y=yX)=3/61/64/65/66/10=1/36
同理,计算 P ( Y = n ∣ X ) = P ( X ∣ Y = n ) ∗ P ( Y = n ) = P ( x 1 ∣ Y = n ) ∗ P ( x 2 ∣ Y = n ) ∗ P ( x 3 ∣ Y = n ) ∗ P ( x 4 ∣ Y = n ) ∗ P ( Y = n ) P(Y=n|X)= P(X|Y=n)*P(Y=n)=P(x1|Y=n)* P(x2|Y=n)* P(x3|Y=n)* P(x4|Y=n)*P(Y=n) P(Y=nX)=P(XY=n)P(Y=n)=P(x1∣Y=n)P(x2∣Y=n)P(x3∣Y=n)P(x4∣Y=n)P(Y=n)
其中,
P ( x 1 ∣ Y = n ) = P ( x 1 = 下雨 ∣ Y = n ) = 1 / 4 P(x1|Y=n)= P(x1=下雨|Y=n)=1/4 P(x1∣Y=n)=P(x1=下雨Y=n)=1/4
P ( x 2 ∣ Y = n ) = P ( x 2 = 高 ∣ Y = n ) = 2 / 4 P(x2|Y=n)= P(x2=高|Y=n)=2/4 P(x2∣Y=n)=P(x2=Y=n)=2/4
P ( x 3 ∣ Y = n ) = P ( x 3 = 中等 ∣ Y = n ) = 1 / 4 P(x3|Y=n)= P(x3=中等|Y=n)=1/4 P(x3∣Y=n)=P(x3=中等Y=n)=1/4
P ( x 4 ∣ Y = n ) = P ( x 4 = 微风 ∣ Y = n ) = 2 / 4 P(x4|Y=n)= P(x4=微风|Y=n)=2/4 P(x4∣Y=n)=P(x4=微风Y=n)=2/4
P ( Y = n ) = 4 / 10 P(Y=n)= 4/10 P(Y=n)=4/10
因此, P ( Y = n ∣ X ) = 1 / 4 ∗ 2 / 4 ∗ 1 / 4 ∗ 2 / 4 ∗ 4 / 10 = 1 / 160 P(Y=n|X)= 1/4*2/4*1/4*2/4*4/10=1/160 P(Y=nX)=1/42/41/42/44/10=1/160
因为 P ( Y = y ∣ X ) > P ( Y = n ∣ X ) P(Y=y|X)> P(Y=n|X) P(Y=yX)>P(Y=nX),故气候状况为雨天,高温,湿度中等,微风时,户外运动应为适合。

5、假如空间中的五个点{A,B,C,D,E},各点之间的距离关系如表2所示,设初始聚类中心点为{A,B},根据所给的数据对其运行K-中心点算法实现第一次迭代后的聚类划分结果及相应的两个中心点(K=2)。(20分)
样本点 A B C D E
A 0 1 2 3 4
B 1 0 3 5 2
C 2 3 0 1 4
D 3 5 1 0 6
E 4 2 4 6 0

根据已知条件,当两个初始中心点为{A,B}时,所得划分为{A,C,D}和{B,E}。
第一次迭代:
假定中心点{A,B}分别被非中心点{C,D,E}替换,根据K-中心点算法需要计算下列代价: T C A C TC_{AC} TCAC T C A D TC_{AD} TCAD T C A E 、 T C B C 、 T C B D 和 T C B E TC_{AE}、TC_{BC}、TC_{BD}和TC_{BE} TCAETCBCTCBDTCBE。其中 T C A C TC_{AC} TCAC表示中心点A被非中心点C代替后的总代价。下面以 T C A C TC_{AC} TCAC为例说明计算过程。
当A被C代替后,看各对象的变化情况。
A:因A离B近, C A A C = d ( A , B ) − d ( A , A ) = 1 − 0 = 1 。 C_{AAC}=d(A,B)-d(A,A)=1-0=1。 CAAC=d(A,B)d(A,A)=10=1
B:B不受影响, C B A C = 0 C_{BAC}=0 CBAC=0
C: C C A C = d ( C , C ) − d ( C , A ) = 0 − 2 = − 2 C_{CAC}=d(C,C)-d(C,A)=0-2=-2 CCAC=d(C,C)d(C,A)=02=2
D: C D A C = d ( D , C ) − d ( D , A ) = 1 − 3 = − 2 C_{DAC}=d(D,C)-d(D,A)=1-3=-2 CDAC=d(D,C)d(D,A)=13=2
E: C E A C = 0 C_{EAC}=0 CEAC=0
于是, T C A C = C A A C + C B A C + C C A C + C D A C + C E A C = 1 + 0 − 2 − 2 + 0 = − 3 TC_{AC}= C_{AAC}+ C_{BAC}+ C_{CAC} + C_{DAC}+ C_{EAC}=1+0-2-2+0=-3 TCAC=CAAC+CBAC+CCAC+CDAC+CEAC=1+022+0=3。同理,可以计算出: T C A D = − 3 , T C A E = 2 , T C B C = − 1 , T C B D = − 1 , T C B E = − 1 TC_{AD}=-3,TC_{AE}=2,TC_{BC} =-1,TC_{BD}=-1,TC_{BE}=-1 TCAD=3TCAE=2TCBC=1TCBD=1TCBE=1
选取最小代价,有两种选择。
选取 T C A C TC_{AC} TCAC为最小代价时,则两个中心点为{B,C},样本被重新划分为{ A,B,E}和{C,D}两个簇。
选取 T C A D TC_{AD} TCAD为最小代价时,则两个中心点为{B,D},样本被重新划分为{ A,B,E}和{C,D}两个簇。文章来源地址https://www.toymoban.com/news/detail-805238.html

到了这里,关于机器学习期中考试的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 机器学习--人工智能概述

    入门人工智能,了解人工智能是什么。为啥发展起来,用途是什么,是最重要也是最关键的事情。大致有以下思路。 人工智能发展历程 机器学习定义以及应用场景 监督学习,无监督学习 监督学习中的分类、回归特点 知道机器学习的开发流程 人工智能在现实生活中的应用

    2024年01月19日
    浏览(44)
  • 人工智能与机器人|机器学习

    原文链接: https://mp.weixin.qq.com/s/PB_n8woxdsWPtrmL8BbehA 机器学习下包含神经网络、深度学习等,他们之间的关系表示如图2-7所示。 图2-7 关系图 那么什么是机器学习、深度学习、他们的区别又是什么呢? 2.7.1 什么是机器学习? 机器学习是 人工智能 (AI) 和计算机科学的一个分支,

    2024年02月06日
    浏览(65)
  • 人工智能、机器学习、深度学习的区别

    人工智能涵盖范围最广,它包含了机器学习;而机器学习是人工智能的重要研究内容,它又包含了深度学习。 人工智能是一门以计算机科学为基础,融合了数学、神经学、心理学、控制学等多个科目的交叉学科。 人工智能是一门致力于使计算机能够模拟、模仿人类智能的学

    2024年02月08日
    浏览(42)
  • 人工智能与开源机器学习框架

    链接:华为机考原题 TensorFlow是一个开源的机器学习框架,由Google开发和维护。它提供了一个针对神经网络和深度学习的强大工具集,能够帮助开发人员构建和训练各种机器学习模型。 TensorFlow的基本概念包括: 张量(Tensor):张量是TensorFlow中的核心数据结构,它表示多维数

    2024年02月22日
    浏览(47)
  • 【人工智能技术】机器学习工具总览

    当谈到训练计算机在没有明确编程的情况下采取行动时,存在大量来自机器学习领域的工具。学术界和行业专业人士使用这些工具在MRI扫描中构建从语音识别到癌症检测的多种应用。这些工具可在网上免费获得。如果您感兴趣,我已经编制了这些的排名(请参阅本页底部)以

    2024年02月04日
    浏览(44)
  • 12、人工智能、机器学习、深度学习的关系

    很多年前听一个机器学习的公开课,在QA环节,一个同学问了老师一个问题“ 机器学习和深度学习是什么关系 ”? 老师先没回答,而是反问了在场的同学,结果问了2-3个,没有人可以回答的很到位,我当时也是初学一脸懵,会场准备的小礼品也没有拿到。 后来老师解释“机

    2024年02月05日
    浏览(56)
  • 一探究竟:人工智能、机器学习、深度学习

    1.1 人工智能是什么?          1956年在美国Dartmounth 大学举办的一场研讨会中提出了人工智能这一概念。人工智能(Artificial Intelligence),简称AI,是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的

    2024年02月17日
    浏览(39)
  • 机器学习、人工智能、深度学习三者的区别

    目录 1、三者的关系 2、能做些什么 3、阶段性目标 机器学习、人工智能(AI)和深度学习之间有密切的关系,它们可以被看作是一种从不同层面理解和实现智能的方法。 人工智能(AI):人工智能是一门研究如何使计算机能够模仿人类智能的学科。它涵盖了各种技术和方法,

    2024年02月14日
    浏览(45)
  • 机器学习、深度学习、人工智能的区别与联系

    大家好,如果没有接触过机器学习,往往对机器学习、深度学习、甚至是人工智能有着模糊的概念。在进行深度的对比人工智能、机器学习和深度学习之后,有助于大家理清概念、选择适当技术,并建立起整个学科的框架,进而可以开展相关目标的学习。 本文将从下面几方面

    2024年01月22日
    浏览(55)
  • 深度学习2.神经网络、机器学习、人工智能

    目录 深度学习、神经网络、机器学习、人工智能的关系 大白话解释深度学习 传统机器学习 VS 深度学习 深度学习的优缺点 4种典型的深度学习算法 卷积神经网络 – CNN 循环神经网络 – RNN 生成对抗网络 – GANs 深度强化学习 – RL 总结 深度学习 深度学习、机器学习、人工智能

    2024年02月11日
    浏览(42)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包