目录
一、研究意义
二、数据来源
三、读取数据
读取数据代码
运行结果截图
四、数据分析绘制箱线图
建立箱线图代码
运行结果截图
五、建立回归模型
建立回归模型代码
运行结果截图
有关于相关系数的计算与检验
六、回归分析
确定回归方程
七、预测中国和美国未来的GDP值、预测中国的GDP赶超美国的时间
数据可视化
八、总结
一、研究意义
GDP作为衡量一个国家经济发展的重要指标,被赋予了非常重要的意义,深刻反映着当下经济发展的现状。中美作为当今世界前两大经济体,在世界经济上有着极大占比并且主导着世界经济的走向。我将两国近十几年GDP进行研究建模模拟预测未来两国GDP的发展趋势从而分析出世界经济格局的变化。
二、数据来源
中经数据CEIdata(https://ceidata.cei.cn/)
三、读取数据
数据为csv文件,大家自行复制,单位均为亿美元。
美国GDP如下:
time | usa |
2005 | 130366.4 |
2006 | 138146.1 |
2007 | 144518.6 |
2008 | 147128.5 |
2009 | 144489.3 |
2010 | 149920.5 |
2011 | 155425.8 |
2012 | 161970.1 |
2013 | 167848.5 |
2014 | 175271.6 |
2015 | 182383 |
2016 | 187450.8 |
2017 | 194796.2 |
2018 | 205271.6 |
2019 | 213725.7 |
2020 | 208937.4 |
2021 | 229961 |
中国GDP如下:
time | CN |
2005 | 22859.66 |
2006 | 27521.32 |
2007 | 35503.43 |
2008 | 45943.07 |
2009 | 51017.03 |
2010 | 60871.64 |
2011 | 75515 |
2012 | 85322.3 |
2013 | 95704.07 |
2014 | 104756.8 |
2015 | 110615.5 |
2016 | 112332.8 |
2017 | 123104.1 |
2018 | 138948.2 |
2019 | 142799.4 |
2020 | 146876.7 |
2021 | 177340.6 |
读取数据代码
GDP1<-read.csv("CNGDP1.csv",header = TRUE)#中国GDP
GDP2<-read.csv("USGDP1.csv",header = TRUE)#美国GDP
GDP1
GDP2
运行结果截图
四、数据分析绘制箱线图
建立箱线图代码
boxplot(GDP1[,2],GDP2[,2],names = c("中国GDP","美国GDP"),col = colors()[10:11],main="中国、美国 2005-2021 年GDP箱线图",ylab="GDP总量(亿美元)")
运行结果截图
从图中可以看出,没有异常值。
五、建立回归模型
通过建立回归模型从而推导出回归方程,利用回归方程中的数值对中国和美国两国未来几十年GDP的走势进行预测,找到转折点,对未来世界的经济走势进行预测。
建立回归模型代码
#线性回归分析
#数据分析,确定回归方程
GDP1 <- ts(GDP1,start = 2005)
GDP2 <- ts(GDP2,start = 2005)
library(car)
#首先确定年份和中国GDP的关系:
scatterplot(GDP1[,2]~GDP1[,1],ylim=c(0,200000),data = GDP1,pch = 19,xlab = "年份",ylab="中国历年GDP值(亿)",cex.lab=0.8)
#确定年份和美国GDP的关系:
scatterplot(GDP2[,2]~GDP2[,1],ylim=c(130000,230000),data = GDP2,pch = 19,xlab = "年份",ylab="美国历年GDP值",cex.lab=0.8)
运行结果截图
- 随着年份增加,中国的GDP值在增长,二者的观测点分布在一条直线的周围,因而具有正线性关系。箱线图显示中国的GDP值呈对称分布。
- 从拟合的曲线来看,线性特征较明显,两个变量有一定量的线性关系。
- 随着年份增加,美国的GDP值在增长,二者的观测点分布在一条直线的周围,因而具有正线性关系。箱线图显示美国的GDP值基本上呈对称分布。
- 从拟合的曲线来看,线性特征较明显,两个变量有一定量的线性关系。
有关于相关系数的计算与检验
cor(GDP1[,1],GDP1[,2])#中国
r=0.9939131相关性很强的正线性相关
cor(GDP2[,2],GDP2[,1])#美国
#r=0.9840649 相关性很强的正线性相关
六、回归分析
确定回归方程
x1 <- GDP1[,1]
y1 <- GDP1[,2]
y2 <- GDP2[,2]
model1 <- lm(y1~x1)
model2 <- lm(y2~x1)
summary(model1)
根据 summary() 函数展示的 model1(年份和中国GDP值)回归拟合的详细结果,可以计算出回归方程:y=9099×年份-18230000
summary(model2) # 展示拟合的详细结果
根据 summary() 函数展示的 model2(年份和美国GDP值)回归拟合的详细结果,可以计算出回归方程:y=5823×年份-11570000
七、预测中国和美国未来的GDP值、预测中国的GDP赶超美国的时间
m <- 1
data1 <- data.frame(year = numeric(), GDP = numeric(), stringsAsFactors=FALSE)
data2 <- data.frame(year = numeric(), GDP = numeric(), stringsAsFactors=FALSE)
for(i in 2022:2080){
a5 <- data.frame(x1=i)
result1 <- predict(model1,a5)
result2 <- predict(model2,a5)
data1[m,1] <- i
data1[m,2] <- result1
data2[m,1] <- i
data2[m,2] <- result2
m <- m+1
}
data1
data2
左图为未来中国GDP预测,有图为未来美国GDP预测,在截图中我只展示了35年以后的预测结果,其中我们可以看出来以纯数据形式展现,观察发现可知,预计2038年时,中国GDP值将超过美国。
数据可视化
data1 <- ts(data1,start = 2019) # 建立时间序列
data2 <- ts(data2,start = 2019) # 建立时间序列
plot(data1[,2],ylim=c(0,710000),lwd=2,xlab="年份",ylab="GDP总值(亿)",main="预测2022-2080年度中国、美国GDP总值趋势图",type="n")
grid(col = "black")
lines(data1[,2],type="l",lwd=3,col="red")
lines(data2[,2],type="l",lwd=3,lty=10,col="blue")
legend(x="topleft",legend = c("中国GDP总值","美国GDP总值"),lty=1:4,col=c("red","blue"))
八、总结
通过模型计算我国GDP将在2038年超越美国。彼时世界经济中心向欧亚大陆的回归,几千年来世界第一强国一直都是亚欧大陆的国家。只有近100多年来是一个例外,被北美大陆的国家美国占据了世界第一强国的位置。国民生活水平很有可能会有一次大幅提升,中国将快速收割全球优质资产和廉价原料。至于政治地位,则需要一个漫长的过程,全球很可能进入一个两主共治的局面。
文章来源地址https://www.toymoban.com/news/detail-770627.html
文章来源:https://www.toymoban.com/news/detail-770627.html
到了这里,关于【R语言数据分析】基于R语言对中、美两国GDP分析(R语言大作业)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!