(一)单选题
1.假设会开车的本科生比例是15%,会开车的研究生比例是23%。若在某大学研究生占学生比例是20%,则会开车的学生是研究生的概率是多少?
A:80%
B:16.6%
C:23%
D:15%
2.下列关于朴素贝叶斯的特点说法错误的是()
A:朴素贝叶斯模型发源于古典数学理论,数学基础坚实
B:朴素贝叶斯模型无需假设特征条件独立
C:朴素贝叶斯处理过程简单,分类速度快
D:朴素贝叶斯对小规模数据表现较好
3.以下算法不属于生成模型 ( )
A:朴素贝叶斯模型
B:混合高斯模型
C:隐马尔科夫模型
D:支持向量机
4.关于拉普拉斯平滑说法正确的是()
A:避免了出现概率为0的情况
B:加上拉普拉斯平滑有助于提高学习性能
C:会使得最终结果可能大于1
D:以上说法都不对
5.假设X和Y都服从正态分布,那么P(X<5,Y<0)就是一个( ),表示X<5,Y<0两个条件同时成立的概率,即两个事件共同发生的概率。
A:先验概率
B:后验概率
C:联合概率
D:以上说法都不对
6.以下算法属于判别模型的是( )
A:朴素贝叶斯模型
B:深度信念网络
C:隐马尔科夫模型
D:线性回归
7.以下算法属于判别模型的是()
A:朴素贝叶斯模型
B:深度信念网络
C:隐马尔科夫模型
D:线性回归
8. 朴素贝叶斯的优点不包括( )
A:算法逻辑简单,易于实现
B:分类过程中时空开销小
C:对缺失数据不太敏感,算法也比较简单,常用于文本分类
D:朴素贝叶斯模型对输入数据的表达形式很敏感
9.市场上某商品来自两个工厂,它们市场占有率分别为60%和40%,有两人各自买一件,则买到的来自不同工厂之概率为( )。
A:0.5
B:0.24
C:0.48
D:0.3
10.以A表示事件"甲种产品畅销,乙种产品滞销",则其对立事件A为( )
A:甲种产品滞销,乙种产品畅销
B:甲,乙两种产品均畅销
C:甲种产品滞销
D:甲种产品滞销或乙种产品畅销
11.关于朴素贝叶斯,下列说法错误的是:( )
A:它是一个分类算法
B:朴素的意义在于它的一个天真的假设:所有特征之间是相互独立的
C:它实际上是将多条件下的条件概率转换成了单一条件下的条件概率,简化了计算
D:朴素贝叶斯不需要使用联合概率
12.掷二枚骰子,事件A为出现的点数之和等于3的概率为( )
A:1/11
B:1/18
C:1/6
D:都不对
12、 问题:公司里有一个人穿了运动鞋,推测是男还是女?已知公司里男性30人,女性70人,男性穿运动鞋的有25人,穿拖鞋的有5人,女性穿运动鞋的有40人,穿高跟鞋的有30人。则以下哪项计算错误()?
选项:
A:p(男|运动鞋)=0.25
B:p(女|运动鞋)=0.4
C:p(运动鞋|男性)=25/30
D:p(运动鞋|女性)=0.4
(二)判断题
1.根据以往经验和分析得到的概率。在这里,我们用P(Y)来代表在没有训练数据前假设Y拥有的初始概率,因此称其为Y的后验概率,它反映了我们所拥有的关于Y的背景知识。
答案: 【错误】
2.朴素贝叶斯模型假设属性之间相互独立,这个假设在实际应用中往往是不成立的,在属性相关性较小时,朴素贝叶斯性能良好。而在属性个数比较多或者属性之间相关性较大时,分类效果不好。
答案: 【正确】
15.朴素贝叶斯对缺失数据较敏感。
答案: 【正确】
16.判别模型所学内容是决策边界。
答案: 【正确】
17.逻辑回归是生成模型,朴素贝叶斯是判别模型
答案: 【错误】
18、 问题:逻辑回归和朴素贝叶斯都有对属性特征独立的要求
答案: 【错误】
19、 问题:朴素贝叶斯法的基本假设是条件独立性。
答案: 【正确】
20、 问题:朴素贝叶斯适用于小规模数据集,逻辑回归适用于大规模数据集。
答案: 【错误】
(三)问答题
1.朴素贝叶斯与逻辑回归的区别是什么?
定义与原理
逻辑回归:是一个用于预测目标变量为二分类或多分类的概率的线性模型。
朴素贝叶斯:是基于贝叶斯定理和特定假设(特征之间相互独立)的一种分类方法。
假设与模型
逻辑回归:假设特征与输出log-odds之间存在线性关系。
朴素贝叶斯:假设特征之间是条件独立的,即给定目标值时,一个特征的存在不会影响其他特征的存在。
适用场景
逻辑回归:当特征与输出之间的关系可以近似为线性关系时,逻辑回归通常表现得较好。
朴素贝叶斯:在文本分类、垃圾邮件识别等需要特征独立性假设的场景中表现良好。
参数估计
逻辑回归:通常使用极大似然估计来确定参数。
朴素贝叶斯:使用先验概率和似然来估计后验概率。
模型表现
逻辑回归:当特征数量很大或存在多重共线性时,可能需要正则化来防止过拟合。
朴素贝叶斯:虽然其“朴素”的假设在许多实际应用中不成立,但它在许多情况下仍然表现得很好。
实际应用
逻辑回归:广泛应用于金融、医疗、社交媒体等领域的分类问题。
朴素贝叶斯:在文本处理、情感分析、垃圾邮件过滤等领域有广泛的应用。
2.朴素贝叶斯“朴素”在哪里?
朴素贝叶斯(Naive Bayes)是一种基于贝叶斯定理的分类技术,它的名称中的“朴素”是指其一个核心假设:特征之间是条件独立的。即给定类别标签后,一个特征的出现不会影响其他特征的出现。“朴素”是假设了特征之间是同等重要、相互独立、互不影响的,但是在我们的现实社会中,属性之间并不是都是互相独立的,有些属性也会存在性,所以说朴素贝叶斯是一种很“朴素”的算法。
具体来说,在许多实际情况中,特征之间确实存在某种依赖关系或关联。例如,在文本分类中,某些词的出现可能与其他词的出现有关。然而,尽管这个假设看起来过于简化,朴素贝叶斯分类器在很多应用中都表现得相当好。
这个简化的假设带来了计算上的便利性。假设特征是条件独立的,意味着我们可以简单地将每个特征的概率相乘,而不需要担心它们之间的复杂交互。
总的来说,“朴素”在朴素贝叶斯中是指它对特征间关系的简化假设,即认为所有特征都是条件独立的。这是一个在很多实际情况下并不完全成立的假设,但这种方法经常在实际应用中得到令人满意的结果。
3.在估计条件概率P((X|Y)时出现概率为0的情况怎么办?
引入拉普拉斯平滑法
4.何为朴素贝叶斯?
朴素贝叶斯是一种简单但强大的分类算法,它基于贝叶斯定理并考虑到了特征的条件独立性。朴素贝叶斯被广泛应用于垃圾邮件检测、文本分类、情感分析等任务。
补充:
贝叶斯定理: 贝叶斯定理描述了随机事件A和B之间的概率关系。数学表示为: P(A∣B)=P(B)P(B∣A)P(A) 在分类任务中, A 通常是类别标签,而 B 是给定的数据或特征。
特征的条件独立性: 朴素贝叶斯分类器的“朴素”之处在于它假设给定类别标签后,所有特征都是条件独立的。这意味着,如果你有一个数据点的多个特征,那么这些特征之间不会相互影响。这种假设简化了计算,尽管在现实世界中,特征间可能存在关联。
模型训练: 为了训练一个朴素贝叶斯分类器,你首先需要计算每个类别的先验概率(即在没有任何其他信息的情况下某个类别出现的概率),以及给定某个类别时每个特征的概率。
预测: 对于一个新的数据点,朴素贝叶斯分类器计算它属于每个类别的后验概率,并选择概率最高的类别作为预测结果。
应用场景: 朴素贝叶斯在特定的应用中效果非常好,特别是在文本分类任务中。例如,判断一封电子邮件是不是垃圾邮件、对产品评论进行情感分析等。文章来源:https://www.toymoban.com/news/detail-694726.html
总之,朴素贝叶斯是一个基于贝叶斯定理的分类方法,其“朴素”是因为它假设所有特征在给定类别标签的条件下是独立的。尽管这种假设在许多真实情境中并不完全成立,但朴素贝叶斯在很多任务上都能得到相当不错的结果。文章来源地址https://www.toymoban.com/news/detail-694726.html
到了这里,关于机器学习课后习题 --- 朴素贝叶斯的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!