【R语言数据分析】基于R语言对中、美两国GDP分析（R语言大作业）

这篇具有很好参考价值的文章主要介绍了【R语言数据分析】基于R语言对中、美两国GDP分析（R语言大作业）。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

一、研究意义

二、数据来源

三、读取数据

读取数据代码

运行结果截图

四、数据分析绘制箱线图

建立箱线图代码

运行结果截图

五、建立回归模型

建立回归模型代码

运行结果截图

有关于相关系数的计算与检验

六、回归分析

确定回归方程

七、预测中国和美国未来的GDP值、预测中国的GDP赶超美国的时间

数据可视化

八、总结

一、研究意义

GDP作为衡量一个国家经济发展的重要指标，被赋予了非常重要的意义，深刻反映着当下经济发展的现状。中美作为当今世界前两大经济体，在世界经济上有着极大占比并且主导着世界经济的走向。我将两国近十几年GDP进行研究建模模拟预测未来两国GDP的发展趋势从而分析出世界经济格局的变化。

二、数据来源

中经数据CEIdata(https://ceidata.cei.cn/)

三、读取数据

数据为csv文件，大家自行复制，单位均为亿美元。

美国GDP如下：

time	usa
2005	130366.4
2006	138146.1
2007	144518.6
2008	147128.5
2009	144489.3
2010	149920.5
2011	155425.8
2012	161970.1
2013	167848.5
2014	175271.6
2015	182383
2016	187450.8
2017	194796.2
2018	205271.6
2019	213725.7
2020	208937.4
2021	229961

中国GDP如下：

time	CN
2005	22859.66
2006	27521.32
2007	35503.43
2008	45943.07
2009	51017.03
2010	60871.64
2011	75515
2012	85322.3
2013	95704.07
2014	104756.8
2015	110615.5
2016	112332.8
2017	123104.1
2018	138948.2
2019	142799.4
2020	146876.7
2021	177340.6

读取数据代码

GDP1<-read.csv("CNGDP1.csv",header = TRUE)#中国GDP
GDP2<-read.csv("USGDP1.csv",header = TRUE)#美国GDP
GDP1
GDP2

运行结果截图

r语言gdp_tidy,数据分析,大数据,r语言

四、数据分析绘制箱线图

建立箱线图代码

boxplot(GDP1[,2],GDP2[,2],names = c("中国GDP","美国GDP"),col = colors()[10:11],main="中国、美国 2005-2021 年GDP箱线图",ylab="GDP总量（亿美元）")

运行结果截图

r语言gdp_tidy,数据分析,大数据,r语言

从图中可以看出，没有异常值。

五、建立回归模型

通过建立回归模型从而推导出回归方程，利用回归方程中的数值对中国和美国两国未来几十年GDP的走势进行预测，找到转折点，对未来世界的经济走势进行预测。

建立回归模型代码

#线性回归分析
#数据分析，确定回归方程
GDP1 <- ts(GDP1,start = 2005)
GDP2 <- ts(GDP2,start = 2005)
library(car)

#首先确定年份和中国GDP的关系：
scatterplot(GDP1[,2]~GDP1[,1],ylim=c(0,200000),data = GDP1,pch = 19,xlab = "年份",ylab="中国历年GDP值(亿)",cex.lab=0.8)

#确定年份和美国GDP的关系：
scatterplot(GDP2[,2]~GDP2[,1],ylim=c(130000,230000),data = GDP2,pch = 19,xlab = "年份",ylab="美国历年GDP值",cex.lab=0.8)

运行结果截图

r语言gdp_tidy,数据分析,大数据,r语言

随着年份增加，中国的GDP值在增长，二者的观测点分布在一条直线的周围，因而具有正线性关系。箱线图显示中国的GDP值呈对称分布。
从拟合的曲线来看，线性特征较明显，两个变量有一定量的线性关系。

r语言gdp_tidy,数据分析,大数据,r语言

随着年份增加，美国的GDP值在增长，二者的观测点分布在一条直线的周围，因而具有正线性关系。箱线图显示美国的GDP值基本上呈对称分布。
从拟合的曲线来看，线性特征较明显，两个变量有一定量的线性关系。

有关于相关系数的计算与检验

cor(GDP1[,1],GDP1[,2])#中国

r=0.9939131相关性很强的正线性相关

cor(GDP2[,2],GDP2[,1])#美国

#r=0.9840649 相关性很强的正线性相关

六、回归分析

确定回归方程

x1 <- GDP1[,1]
y1 <- GDP1[,2]
y2 <- GDP2[,2]
model1 <- lm(y1~x1) 
model2 <- lm(y2~x1) 
summary(model1)

r语言gdp_tidy,数据分析,大数据,r语言

根据 summary() 函数展示的 model1（年份和中国GDP值）回归拟合的详细结果，可以计算出回归方程：y=9099×年份-18230000

summary(model2) # 展示拟合的详细结果

r语言gdp_tidy,数据分析,大数据,r语言

根据 summary() 函数展示的 model2（年份和美国GDP值）回归拟合的详细结果，可以计算出回归方程：y=5823×年份-11570000

七、预测中国和美国未来的GDP值、预测中国的GDP赶超美国的时间

m <- 1
data1 <- data.frame(year = numeric(), GDP = numeric(), stringsAsFactors=FALSE)
data2 <- data.frame(year = numeric(), GDP = numeric(), stringsAsFactors=FALSE)
for(i in 2022:2080){
    a5 <- data.frame(x1=i)
    result1 <- predict(model1,a5)
    result2 <- predict(model2,a5)
    data1[m,1] <- i
    data1[m,2] <- result1
    data2[m,1] <- i
    data2[m,2] <- result2
    m <- m+1
}
data1
data2

r语言gdp_tidy,数据分析,大数据,r语言

左图为未来中国GDP预测，有图为未来美国GDP预测，在截图中我只展示了35年以后的预测结果，其中我们可以看出来以纯数据形式展现，观察发现可知，预计2038年时，中国GDP值将超过美国。

数据可视化

data1 <- ts(data1,start = 2019) # 建立时间序列
data2 <- ts(data2,start = 2019) # 建立时间序列
plot(data1[,2],ylim=c(0,710000),lwd=2,xlab="年份",ylab="GDP总值（亿）",main="预测2022-2080年度中国、美国GDP总值趋势图",type="n")
grid(col = "black")
lines(data1[,2],type="l",lwd=3,col="red")
lines(data2[,2],type="l",lwd=3,lty=10,col="blue")
legend(x="topleft",legend = c("中国GDP总值","美国GDP总值"),lty=1:4,col=c("red","blue"))

r语言gdp_tidy,数据分析,大数据,r语言

八、总结

通过模型计算我国GDP将在2038年超越美国。彼时世界经济中心向欧亚大陆的回归，几千年来世界第一强国一直都是亚欧大陆的国家。只有近100多年来是一个例外，被北美大陆的国家美国占据了世界第一强国的位置。国民生活水平很有可能会有一次大幅提升，中国将快速收割全球优质资产和廉价原料。至于政治地位，则需要一个漫长的过程，全球很可能进入一个两主共治的局面。

文章来源地址https://www.toymoban.com/news/detail-770627.html

到了这里，关于【R语言数据分析】基于R语言对中、美两国GDP分析（R语言大作业）的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！