统计学-R语言-6.4

这篇具有很好参考价值的文章主要介绍了统计学-R语言-6.4。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。


前言

本片是对以上三个介绍的篇章的题进行介绍。


总体均值的区间估计

1、利用下面的信息,构建总体均值μ的置信区间:
统计学-R语言-6.4,r语言,开发语言
总体均值的区间估计(大样本的估计)
统计学-R语言-6.4,r语言,开发语言
利用下面的信息,构建总体均值μ的置信区间:
(1)总体不服从正态分布,已知 统计学-R语言-6.4,r语言,开发语言,n=35, =8900,s=510,置信水平为95%

q<-qnorm(0.975)
LCI<-8900-q*(500/sqrt(35))
UCI<-8900+q*(500/sqrt(35))
data.frame(LCI,UCI)

统计学-R语言-6.4,r语言,开发语言
(2)总体不服从正态分布, 统计学-R语言-6.4,r语言,开发语言未知,n=35, 统计学-R语言-6.4,r语言,开发语言=8900,s=510,置信水平为90%

q<-qnorm(0.95)
LCI<-8900-q*(510/sqrt(35))
UCI<-8900+q*(510/sqrt(35))
data.frame(LCI,UCI)

统计学-R语言-6.4,r语言,开发语言
(3)总体不服从正态分布, 统计学-R语言-6.4,r语言,开发语言未知,n=100, 统计学-R语言-6.4,r语言,开发语言=8900,s=510,置信水平为95%

q<-qnorm(0.975)
LCI<-8900-q*(510/sqrt(100))
UCI<-8900+q*(510/sqrt(100))
data.frame(LCI,UCI)

统计学-R语言-6.4,r语言,开发语言

2、下面是10家企业2015年上半年缴税额数据(单位:元),根据这个样本对这类企业缴税额的总体均值𝝁做出区间估计,置信度取95%
统计学-R语言-6.4,r语言,开发语言
该总体方差未知,小样本情形
假定该总体有正态分布。在R中采用下面的语句求出置信区间:

tax=c(283192,232600,51000,191927,16281,449066,673669,315000,293515,331624)
t.test(tax,con=.95)$conf  #R语言内置函数t.test,t.test(x,conf.level=0.95)用于求95%置信区间#$conf用于获取置信度

[1] 149005.9 418568.9

attr(,"conf.level")#attr(x,which):得到或设置x的属性

[1] 0.95

统计学-R语言-6.4,r语言,开发语言

3、一家人才测评机构对随机抽取的10名小企业的经理人用两种方法进行自信心测试,得到的自信心测试分数如下:
构建两种方法平均自信心得分之差的95%的置信区间。
统计学-R语言-6.4,r语言,开发语言

load("C:/example/ch5/exercise5_7.RData")
t.test(exercise5_7$方法1,exercise5_7$方法2,paired=TRUE)$conf.int

统计学-R语言-6.4,r语言,开发语言

总体比例的区间估计

1、从两个总体中各抽取一个n1=n2=250的独立随机样本,来自总体1的样本比例为p1=40%,来自总体2的样本比例为p2=30%
(1)求 统计学-R语言-6.4,r语言,开发语言的90%的置信区间

n1=250;n2=250
p1=0.4;p2=0.3
q1<-qnorm(0.95)
LCI<-p1-p2-q1*sqrt(p1*(1-p1)/n1+p2*(1-p2)/n2)
UCI<-p1-p2+q1*sqrt(p1*(1-p1)/n1+p2*(1-p2)/n2)
data.frame(UCI,LCI)

统计学-R语言-6.4,r语言,开发语言

(2)求 统计学-R语言-6.4,r语言,开发语言的95%的置信区间

n1=250;n2=250
p1=0.4;p2=0.3
q2<-qnorm(0.975)
UCI<-p1-p2-q2*sqrt(p1*(1-p1)/n1+p2*(1-p2)/n2)
LCI<-p1-p2+q2*sqrt(p1*(1-p1)/n1+p2*(1-p2)/n2)
data.frame(LCI,UCI)

统计学-R语言-6.4,r语言,开发语言

总体方差的区间估计

顾客到银行办理业务时住需要等待一些时间,而等待时间的长短与许多因素有关,比如银标的业务员办理业务的速度、顾客等待排队的方式等等。为此,某银行准备采取两种排队方式进行试验,第一种排队方式是所有顾客都进入一个等待队伍,第二种排队方式是顾客在三个业务ロ处列队三排等待为比较哪种排队方式使顾客等待的时间更短,银行各随机抽取10名顾客,他们在办理业务时所等待的时间(单位:分钟)如下
(1)构建第二种排队方式等待时间方差的95%的置信区间
统计学-R语言-6.4,r语言,开发语言

library(TeachingDemos)
sigma.test(exercise5_5$方式2,conf.level=0.95)$conf.int

统计学-R语言-6.4,r语言,开发语言

样本量的确定

统计学-R语言-6.4,r语言,开发语言
确定合适的样本量需要综合考虑以下三因素:
(1)希望达到的置信度。置信度越高,要求样本量越大
(2)研究者可以承受的误差范围。最大可容许误差 (maximum allowable error)越小,要求样本量越大;反之,样本量越小
(3)所研究总体的标准差。如果总体的离散程度较高, 要求样本量较大;如果总体比较集中或一致,则要求的 样本量较小。然而,在通常的情况下我们并不知道总体标准差,因此必须对其进行估计。

1、青原博士对毕业生起薪进行调查。假设最大可容许误差E为100元,90%置信度所对应的z值为1.64485,即z0.05=1.64485,总体标准差的估计为2000元。需要多少样本量?
最大容许误差、总体标准差的估计以及z值都已知,将数据代入估计总体均值所需样本量的公式,可得样本量

z=qnorm(0.05,low=F)#计算z值
z  

[1]1.64485

s=2000 #总体标准差
E=100#要求的最大可容许误差
n=(z*s/E)^2#计算所需样本量
n

[1] 1082.217
样本量计算的结果通常并不是整数。当出现这种情况时,取不小于该数的最小整数
对于此例,结果为1082.217,取样本量为1083。也这就是说样本量至少为1083个。
如果提高置信度到95%,在95%的置信度下对应的z值为
1.95996

z1=qnorm(0.025,low=F)#计算z值
n1=(z1*s/E)^2#计算所需样本量
n1

[1] 1536.584

此时的样本量取1537
置信度提高,则样本量应相应增大
具体来看,当置信度由95%提高到99%时,样本量增加280
这会大大增加调查的时间和成本,因此置信度的选择应该慎重

关于比例估计问题样本量的确定,与上面的过程基本 一致,也有三个因素需要确定:
(1)希望达到的置信度
(2)研究者可以承受的误差大小
(3)总体比例的估计
总体比例的样本量由下面的公式确定:
统计学-R语言-6.4,r语言,开发语言
统计学-R语言-6.4,r语言,开发语言
2、在延迟退休支持比例的调查中,假设最大可容许误差E为0 . 1 , 90 % 的置信度所对应的z值为1 . 64485 , 即 z0.05=1.64485,那么需要调查的样本量是多少?

z=qnorm(0.05,low=F)#计算z值
hat.p=0.5 #总体比例p的估计
E=0.1#要求的最大可容许误差
n=hat.p*(1-hat.p)*(z/E)^2#计算所需样本量
n

[1] 96.03647
解出n=96.03647。取大于它的最小整数, 得到n=97。


总结

以上就是本节的练习题介绍。文章来源地址https://www.toymoban.com/news/detail-807707.html

到了这里,关于统计学-R语言-6.4的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 统计学-R语言-4.7

    本篇文章将介绍数据的描述统计量。 平均数也称为均值,常用的统计量之一 消除了观测值的随机波动 易受极端值的影响 根据总体数据计算的,称为总体平均数,记为;根据样本数据计算的,称为样本平均数,记为 。 设一组数据为:x1 ,x2 ,… ,xn (总体数据xN) 。 计算

    2024年01月16日
    浏览(38)
  • 统计学-R语言-2.2

    本篇文章是将上篇得软件安装完,对其部分功能进行介绍。 在我们日常练习时会有.RData文件导入,并对其进行分析,下面是两种方导入.RData文件。 直接找到自己下载的.RData文件,双击进行打开即可。 上面得工具栏中找到文件。 在里面找到打开程序脚本,找到你所保存的.R

    2024年02月02日
    浏览(32)
  • 统计学-R语言-4.5

    本篇文章将继续对数据的类型做介绍,本片也是最后一个介绍数据的。 掌握描述多变量数据的分析方法:多维列联表、复式条形图、并列箱线图、点带图、多变量散点图(重叠散点图和矩阵式散点图)。 除了一维表、二维表,在实际中更多的是多维表,也就是多个变量交叉

    2024年02月01日
    浏览(48)
  • 统计学-R语言-5.3

    本篇文章即为概率与分布的最后一篇文章。 分位数函数是累积分布函数的反函数。 p-分位数是具有这样性质的一个值:小于或等于它的概率为p。 根据定义,中位数即50%分位数。 分位数通常用于置信区间的计算,以及与设计试验有关的势函数的计算。 下面给出一个置信区间

    2024年01月18日
    浏览(46)
  • 统计学-R语言-5.2

    本篇文章将继续上篇的进行介绍。 大数定理大数定理”的另一种表达方式是“均值定理”,其含义是,随机变量X多个观察值的均值会随着观察值的增加越发趋近于总体的期望值,中心极限定理进一步告诉我们,均值服从期望为μ 的正态分布。在各种测量试验中,我们一般都

    2024年01月18日
    浏览(42)
  • 统计学-R语言-4.3

    本篇介绍的是数值型数据怎么进行数据可视化,本篇介绍的有直方图、茎叶图、箱线图。 直方图(Histogram)用于描述连续型变量的频数分布,实际应用中常用于考察变量的分布是否对称;是否服从某种分布类型,如正态分布 直方图以矩形的面积表示各组段的频数或频率, 各

    2024年01月16日
    浏览(42)
  • 统计学-R语言-4.1

    安装完R软件之后就可以对其进行代码的编写了。 如果对数据分析有些特殊需要,已有的R包或函数不能满足,可以在R中编写自己的函数。函数的定义格式如下所示: 该式中, functionname是函数名称; function指明该对象为函数类型;a1,a2,为函数中涉及的参数; expression是函数

    2024年01月16日
    浏览(35)
  • 统计学-R语言-6.2

    本篇将继续介绍上篇所剩下的内容。 设两个总体的均值分别为1和2,从两个总体中分别抽取样本量为n1和n2的两个随机样本,其样本均值分别为 和 。估计两个总体均值之差(u1-u2)的点估计量显然是两个样本的均值之差( )。 两个总体均值的置信区间是由两个样本均值之

    2024年01月18日
    浏览(39)
  • 统计学-R语言-2.1

    上篇文章介绍了统计学-R语言的介绍,本篇文章介绍如何安装R软件。 可以登录官网,https://www.r-project.org/,点击此处跳转。 点进去下滑找到China,之后找任意一个链接地址进行下载即可。 我点的是第二个,进入后在红框中选择自己对应得版本进行下载。 第一次安装点击红框处

    2024年02月02日
    浏览(27)
  • 统计学-R语言-7.2

    本篇将继续上篇文章进行介绍。 小样本的检验 假定条件 小样本(n30) 总体服从正太分布 检验统计量的选择与总体方差是否已知有关 已知样本,均值经标准化后服从标准正态分布: 单样本t检验的效应量通常使用 Cohen的d统计量来度量,计算公式为: 该效应量表示样本均值与假

    2024年01月21日
    浏览(43)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包