数据挖掘(Data Mining)第二章课后习题

这篇具有很好参考价值的文章主要介绍了数据挖掘(Data Mining)第二章课后习题。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

1、下面哪个不属于数据的属性类型(  相异  )

2、属于定量的属性类型是(  区间  )

3、一所大学内的各年纪人数分别为:一年级200人,二年级160人,三年级130人,四年级110人。则年级属性的众数是(  一年级  )

4、考虑数据集{12 24 33 24 55 68 26},其四分位数极差是(  31  )

5、光年所属的属性类型为(  比率标度属性  )

6、军衔所属的属性类型为(  序数属性  )

7、计算p1(2,1,4,10)和p2(3,0,3,8)两个对象之间的曼哈顿距离(  5  )

8、用AM 和PM 表示的时间的属性类型是(  二元  )

9、某部门的月薪情况如下(单位:千元),30,33,48,50,53,53,57,60,64,68,70,70,90,则该部门员工的月薪的均值为(  57.38  )千元(结果保留两位小数)

10、数据集{5,10,11,13,15,15,35,50,55,72,92,204,215}的中位数为(  35  ),众数为(  15  )

11、人的血型属于标称属性。( 对 )

12、离散属性总是具有有限个值。( 错 )

13、标称属性的值提供了足够的信息用于区分对象。( 对 )

14、二元属性的相异性有两种,一种是对称的二元相异性,另一种是非对称的二元相异性。( 对 )

15、已知点X的空间坐标为(3,4,2),点Y的空间坐标为(1,6,1),则X与Y的欧几里得距离为3。( 对 )

16、只有非零值才重要的二元属性被称作非对称二元属性。( 对 )

17、中心趋势度量包括均值、众数、中位数和中列数。( 对 )

18、已知点A的空间坐标为(6,30,9),点B的空间坐标为(10,35,2),则A与B之间的切比雪夫距离为7。( 对 )

19、属性可以分为标称属性、二元属性、序数属性和数值属性四类。( 对 )

20、假设给定的数据集的值已经分组为区间。区间和对应的频率如下。 则数据的近似分组中位数是(  32.94  )(结果保留两位小数)

数据挖掘课后题答案第二章,数据挖掘(Data Mining),数据挖掘,人工智能

 21、假设小明某一学期的考试成绩及每门课的学分如下表所示,则小明本学期的加权平均成绩为(  81.45  )(结果保留两位小数)

数据挖掘课后题答案第二章,数据挖掘(Data Mining),数据挖掘,人工智能

22、给定两个对象的元组x=(4,3,5,1)与y=(1,6,7,3),它们之间的余弦相似度为(  0.86  )(结果保留两位小数) 

23、小明参加数学竞赛选拔赛,他十次测试成绩为:76,84,90,86,81,87,86,82,85,83。则小明同学十次测试成绩的方差是(  13.2  )(结果保留两位小数)

24、某组同学的成绩评定结果如下, 则A与B,A与C,B与C之间的相异性是(  1.05  )、(  0.82  )和(  0.82  )(结果均保留两位小数)

数据挖掘课后题答案第二章,数据挖掘(Data Mining),数据挖掘,人工智能

25、某部门的月薪情况如下(单位:千元),30,33,48,50,53,53,57,60,64,68,70,70,90,则该部门员工的月薪的均值为(  57.38  )千元(结果保留两位小数) 

26、酒店的星级属于数值属性。( 错 )

27、某品种玉米苗中抽取10株,测得它们的株高为:21,42,39,14,19,22,37,41,40,25(单位:cm),则玉米苗株高的标准差为10.21。( 对 )

28、数值属性的值提供足够的信息确定对象的顺序。( 错 )

29、欧几里得距离、曼哈顿距离、闵可夫斯基距离和切比雪夫距离均满足非负性、同一性和三角不等式。( 对 )

30、余弦相似性利用向量空间中两个向量夹角的余弦值来衡量两个个体间的差异。余弦值越接近0,夹角越大,向量之间匹配越大。余弦值越接近1,夹角越小,向量之间匹配越小。( 错 )

31、计算由不对称的二元变量描述的对象间的相异度可以使用 Jaccard 系数;计算用分类变量描述的对象间的相异度可以采用属性值匹配的方法(属性值匹配,相似度为1,否则为0)。( 对 )

32、给定两个词向量元祖A(6,2,5,8)和B(4,5,2,6),则这两个对象之间的闵可夫斯基距离(其中h=4)是3.73。(结果保留两位小数)。( 对 )

33、假定用于分析的数据包含属性age,数据元组中age 的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,25,30,33,33,35,35,35,35,36,40,45,45,52,70。则该组数据的中列数是41.5。( 对 )文章来源地址https://www.toymoban.com/news/detail-719210.html

到了这里,关于数据挖掘(Data Mining)第二章课后习题的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • SV学习——数据类型(第二章)

    verilog有1995和2001版本,而SV是verilog的延伸,SV发布的时候直接就是3.0,之后可能不再存在verilog,而是统一用SV。SV是完全兼容verilog的。verilog文件以.v结尾,SV文件以.sv结尾。语法是全部兼容的,SV是verilog的扩展和延伸。 verilog中有reg和wire两种数据类型,都是四值逻辑 0,1,x,

    2024年02月10日
    浏览(77)
  • 大数据之路-日志采集(第二章)

    阿里巴巴的日志采集体系方案包括两大体系: Ap us.JS Web(基于浏览器)日志采集技术方案: UserTrack APP 端(无线客户端 日志采集技术方案。 本章从浏览器的页面日志采集、无线客户端的日志采集以及我们遇到的日志采集挑战三块内容来阐述间里巴巴的日志采集经验。 浏览器

    2024年01月25日
    浏览(48)
  • 【第二章:数据的表示和运算】

    探讨的两大主题:一步步递进 那么现在就需要探究 数据如何以2进制的形式在计算机中表示的呢?? 那么还有就是计算机如何进行数据的算术和逻辑运算的?? 我们平常使用的是10进制的数据,然而计算机能够识别的是2进制的01序列串。 主要是权重的不同。一方面符号表示

    2024年02月04日
    浏览(46)
  • 【数据结构】第二章——线性表(4)

    大家好,很高兴又和大家见面啦!!! 在前面的内容中我们介绍了线性表的第一种存储方式——顺序存储,相信大家经过前面的学习应该已经掌握了对顺序表的一些基本操作了。今天,我们将开始介绍线性表的第二种存储方式——链式存储。 线性表中的数据元素在存储时,

    2024年02月04日
    浏览(49)
  • 【数据结构】第二章——线性表(3)

    大家好,很高兴又和大家见面了!!! 在上一篇中,咱们介绍了顺序表的基本概念,以及通过C语言实现顺序表的创建和对表长的修改。今天咱们将详细介绍一下使用C语言实现顺序表的增删改查。接下来,跟我一起来看看今天的内容吧!!! 我们先来回顾一下上一篇的内容,

    2024年02月04日
    浏览(54)
  • 第二章 数据处理篇:transforms

    教程参考: https://pytorch.org/tutorials/ https://github.com/TingsongYu/PyTorch_Tutorial https://github.com/yunjey/pytorch-tutorial 详细的transform的使用样例可以参考:ILLUSTRATION OF TRANSFORMS 你得到的原始数据,可能并不是你期望的用于模型训练的数据的形式,比如数据中图像的大小不同、数据的格式不

    2024年02月08日
    浏览(36)
  • 【数据结构】第二章——线性表(2)

    大家好,很高兴又和各位见面啦!!!在上一个篇章中,我们简单了解了一下线性表的基础知识以及一下重要的术语。在今天的篇章中我们将来开始正式介绍线性表的顺序存储——又称顺序表。我们将会在本章介绍什么是顺序表,对于顺序表的操作我们又应该如何实现。接下

    2024年02月03日
    浏览(50)
  • 【数据结构】第二章——线性表(1)

    大家好,很高兴又和大家见面啦!!!从今天开始,我们将进入线性表的学习。 线性表是算法题命题的重点。这类算法题实现起来比较容易且代码量较少,但是要求具有最优的性能(时间复杂度、空间复杂度),因此,我们应该牢固掌握线性表的各种基本操作(基于两种存储

    2024年02月03日
    浏览(50)
  • 数据结构基础内容-----第二章算法

    算法 是指,解决问题或执行任务的一系列步骤、规则或指令的有序集合。它可以用来解决各种不同的问题,例如搜索、排序、优化、图像和语音识别等。在计算机科学中,算法通常用于编写程序以实现特定任务。算法可以被用于各种不同的领域,如人工智能、机器学习、数据

    2024年02月06日
    浏览(50)
  • 【计组考点】:第二章 数据信息的表示

    根据学校课件总结的计组考点,用过的都说好! 目录 1.机器数 2.原码、反码、补码的转换 ​3.字长为N时,能表示的数据范围​ 4.变形码 5.BCD码与移码 6.说明浮点数与定点数的特点 7.输入码、机内码、字形码的区别 8.海明码 9.CRC循环冗余校验码 最后🧁 加油!!!

    2024年01月17日
    浏览(63)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包