一、参数估计
1⃣️ 估计
· 分布剖析
有两条法则可以告诉你:大部分数据落在概率分布中的哪个区域。
经验法则——适用于符合正态分布的任何数据集。表明:几乎所有的数据都位于距离均值3个标准差的范围内。具体:
大约68%的数值位于距离均值1个标准差的范围内;
大约95%的数值位于距离均值2个标准差的范围内;
大约99.7%的数值位于距离均值3个标准差的范围内。
切比雪夫不等式——适用于任何数据集。表明:对于任意分布,都至少有1-1/k^2的X落在离均值k个标准差的范围内。具体:
至少75%的数值位于距离均值2个标准差的范围内;
至少89%的数值位于距离均值3个标准差的范围内;
至少94%的数值位于距离均值4个标准差的范围内。
· 参数估计
· 步骤:选定参数——选定统计量——抽样分布——得出结果
· 定义
参数估计:用样本统计量去估计总体的参数
估计量:用来估计总体参数的统计量
估计值:根据一个具体的样本计算出来的估计量的数值
· 抽样分布
1)样本均值的抽样分布
2)样本比例的抽样分布
由二项分布的原理和渐近分布的理论,当n充分大时,np>5且np>5时,p的分布可用正态分布去逼近,即:
P~N(p,pq/n)
切忌:须进行连续型修正+-1/2n
3)样本方差的抽样分布
· 评价估计量的三标准
无偏性:估计量抽样分布的数学期望等于被估计的总体参数
有效性:也称最小方差性,即方差越小的估计量越有效
一致性:随着样本容量的增大,估计量的值越来越接近被估计的总体参数
· 估计-得出结果
两类方法
· 点估计
定义:用样本估计量构造的某一个值直接作为总体参数的估计值
具体方法:矩估计法、最大似然法、顺序统计量估计法、最小二乘法
特点:优点(简单、精确);缺点(不准确)
· 区间估计
定义:在点估计的基础上,给出总体参数估计的一个区间范围,该区间通常由样本统计量加减估计误差得到。
置信区间:在区间估计中,由样本统计量所构造的总体参数的估计区间文章来源:https://www.toymoban.com/news/detail-474459.html
置信水平:置信区间中包含总体参数真值的次数所占的比例文章来源地址https://www.toymoban.com/news/detail-474459.html
到了这里,关于PART 4 描述性统计分析的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!