【R语言数据分析】基于R语言对中、美两国GDP分析(R语言大作业)

这篇具有很好参考价值的文章主要介绍了【R语言数据分析】基于R语言对中、美两国GDP分析(R语言大作业)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

目录

一、研究意义

二、数据来源

三、读取数据

读取数据代码

运行结果截图

四、数据分析绘制箱线图

建立箱线图代码

运行结果截图 

五、建立回归模型

建立回归模型代码

 运行结果截图

有关于相关系数的计算与检验

 六、回归分析

确定回归方程

七、预测中国和美国未来的GDP值、预测中国的GDP赶超美国的时间

数据可视化

八、总结


 一、研究意义

GDP作为衡量一个国家经济发展的重要指标,被赋予了非常重要的意义,深刻反映着当下经济发展的现状。中美作为当今世界前两大经济体,在世界经济上有着极大占比并且主导着世界经济的走向。我将两国近十几年GDP进行研究建模模拟预测未来两国GDP的发展趋势从而分析出世界经济格局的变化。

二、数据来源

中经数据CEIdata(https://ceidata.cei.cn/)

三、读取数据

数据为csv文件,大家自行复制,单位均为亿美元。

美国GDP如下:

time usa
2005 130366.4
2006 138146.1
2007 144518.6
2008 147128.5
2009 144489.3
2010 149920.5
2011 155425.8
2012 161970.1
2013 167848.5
2014 175271.6
2015 182383
2016 187450.8
2017 194796.2
2018 205271.6
2019 213725.7
2020 208937.4
2021 229961

中国GDP如下:

time CN
2005 22859.66
2006 27521.32
2007 35503.43
2008 45943.07
2009 51017.03
2010 60871.64
2011 75515
2012 85322.3
2013 95704.07
2014 104756.8
2015 110615.5
2016 112332.8
2017 123104.1
2018 138948.2
2019 142799.4
2020 146876.7
2021 177340.6

读取数据代码

GDP1<-read.csv("CNGDP1.csv",header = TRUE)#中国GDP
GDP2<-read.csv("USGDP1.csv",header = TRUE)#美国GDP
GDP1
GDP2

运行结果截图

r语言gdp_tidy,数据分析,大数据,r语言 r语言gdp_tidy,数据分析,大数据,r语言

 四、数据分析绘制箱线图

建立箱线图代码

boxplot(GDP1[,2],GDP2[,2],names = c("中国GDP","美国GDP"),col = colors()[10:11],main="中国、美国 2005-2021 年GDP箱线图",ylab="GDP总量(亿美元)")

运行结果截图 

r语言gdp_tidy,数据分析,大数据,r语言

从图中可以看出,没有异常值。

五、建立回归模型

通过建立回归模型从而推导出回归方程,利用回归方程中的数值对中国和美国两国未来几十年GDP的走势进行预测,找到转折点,对未来世界的经济走势进行预测。

建立回归模型代码

#线性回归分析
#数据分析,确定回归方程
GDP1 <- ts(GDP1,start = 2005)
GDP2 <- ts(GDP2,start = 2005)
library(car)
#首先确定年份和中国GDP的关系:
scatterplot(GDP1[,2]~GDP1[,1],ylim=c(0,200000),data = GDP1,pch = 19,xlab = "年份",ylab="中国历年GDP值(亿)",cex.lab=0.8)
#确定年份和美国GDP的关系:
scatterplot(GDP2[,2]~GDP2[,1],ylim=c(130000,230000),data = GDP2,pch = 19,xlab = "年份",ylab="美国历年GDP值",cex.lab=0.8)

 运行结果截图

r语言gdp_tidy,数据分析,大数据,r语言

  • 随着年份增加,中国的GDP值在增长,二者的观测点分布在一条直线的周围,因而具有正线性关系。箱线图显示中国的GDP值对称分布。
  • 从拟合的曲线来看,线性特征较明显,两个变量有一定量的线性关系。

r语言gdp_tidy,数据分析,大数据,r语言

  • 随着年份增加,美国的GDP值在增长,二者的观测点分布在一条直线的周围,因而具有正线性关系。箱线图显示美国的GDP值基本上呈对称分布。
  • 从拟合的曲线来看,线性特征较明显,两个变量有一定量的线性关系。

有关于相关系数的计算与检验

cor(GDP1[,1],GDP1[,2])#中国

r=0.9939131相关性很强的正线性相关 

cor(GDP2[,2],GDP2[,1])#美国

#r=0.9840649 相关性很强的正线性相关 

 六、回归分析

确定回归方程

x1 <- GDP1[,1]
y1 <- GDP1[,2]
y2 <- GDP2[,2]
model1 <- lm(y1~x1) 
model2 <- lm(y2~x1) 
summary(model1) 

r语言gdp_tidy,数据分析,大数据,r语言

根据 summary() 函数展示的 model1(年份和中国GDP值)回归拟合的详细结果,可以计算出回归方程:y=9099×年份-18230000

summary(model2) # 展示拟合的详细结果

r语言gdp_tidy,数据分析,大数据,r语言

根据 summary() 函数展示的 model2(年份和美国GDP值)回归拟合的详细结果,可以计算出回归方程:y=5823×年份-11570000

七、预测中国和美国未来的GDP值、预测中国的GDP赶超美国的时间

m <- 1
data1 <- data.frame(year = numeric(), GDP = numeric(), stringsAsFactors=FALSE)
data2 <- data.frame(year = numeric(), GDP = numeric(), stringsAsFactors=FALSE)
for(i in 2022:2080){
    a5 <- data.frame(x1=i)
    result1 <- predict(model1,a5)
    result2 <- predict(model2,a5)
    data1[m,1] <- i
    data1[m,2] <- result1
    data2[m,1] <- i
    data2[m,2] <- result2
    m <- m+1
}
data1
data2

r语言gdp_tidy,数据分析,大数据,r语言    r语言gdp_tidy,数据分析,大数据,r语言

左图为未来中国GDP预测,有图为未来美国GDP预测,在截图中我只展示了35年以后的预测结果,其中我们可以看出来以纯数据形式展现,观察发现可知,预计2038年时,中国GDP超过美国。

数据可视化

data1 <- ts(data1,start = 2019) # 建立时间序列
data2 <- ts(data2,start = 2019) # 建立时间序列
plot(data1[,2],ylim=c(0,710000),lwd=2,xlab="年份",ylab="GDP总值(亿)",main="预测2022-2080年度中国、美国GDP总值趋势图",type="n")
grid(col = "black")
lines(data1[,2],type="l",lwd=3,col="red")
lines(data2[,2],type="l",lwd=3,lty=10,col="blue")
legend(x="topleft",legend = c("中国GDP总值","美国GDP总值"),lty=1:4,col=c("red","blue"))

 r语言gdp_tidy,数据分析,大数据,r语言

八、总结

通过模型计算我国GDP将在2038年超越美国。彼时世界经济中心向欧亚大陆的回归,几千年来世界第一强国一直都是亚欧大陆的国家。只有近100多年来是一个例外,被北美大陆的国家美国占据了世界第一强国的位置。国民生活水平很有可能会有一次大幅提升,中国将快速收割全球优质资产和廉价原料。至于政治地位,需要一个漫长的过程,全球很可能进入一个两主共治的局面

 文章来源地址https://www.toymoban.com/news/detail-770627.html

 

 

 

 

 

到了这里,关于【R语言数据分析】基于R语言对中、美两国GDP分析(R语言大作业)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • R语言 | 数据分析——统计绘图

    目录 一、分类数据的图形描述 1.1 条形图barplot()函数 1.2 饼图pie()函数  二、量化数据的图形描述 2.1 点图与dotchart()函数 2.2 绘图函数plot()  2.2.1 绘制时间数列对象 ​2.2.2 向量数据与plot()函数 2.2.3 数据框数据与plot()函数 2.2.4  因子型数据与plot()函数 ​2.2.5 使用lines()函数绘制回

    2024年02月04日
    浏览(49)
  • 数据分析课程设计(数学建模+数据分析+数据可视化)——利用Python开发语言实现以及常见数据分析库的使用

    目录 数据分析报告——基于贫困生餐厅消费信息的分类与预测 一、数据分析背景以及目标 二、分析方法与过程 数据探索性与预处理 合并文件并检查缺失值 2.计算文件的当中的值 消费指数的描述性分析 首先对数据进行标准化处理 聚类模型的评价 聚类模型的结果关联 利用决

    2024年02月12日
    浏览(57)
  • R语言数据分析笔记——方差分析(单因素方差分析、双因素方差分析)在Excel、SPSS、R语言中的操作)

    前言:本文为个人学习笔记,为各大网站上的教学内容之综合整理,综合整理了①方差分析的基础知识、②方差分析(单因素方差分析、双因素方差分析)在Excel、SPSS、R语言中的操作),尽量标明出处。另因能力所限或有纰漏之处,故仅供参考,欢迎交流指正。 基本概念 指

    2024年02月05日
    浏览(48)
  • R语言地理加权回归、主成份分析、判别分析等空间异质性数据分析

    在自然和社会科学领域有大量与地理或空间有关的数据,这一类数据一般具有严重的空间异质性,而通常的统计学方法并不能处理空间异质性,因而对此类型的数据无能为力。以地理加权回归为基础的一系列方法:经典地理加权回归,半参数地理加权回归、多尺度地理加权回

    2024年02月14日
    浏览(47)
  • 自然语言处理与大数据:如何提高数据分析效率

    自然语言处理(NLP,Natural Language Processing)是计算机科学与人工智能领域的一个分支,研究如何让计算机理解、生成和处理人类语言。自然语言处理技术广泛应用于各个领域,包括机器翻译、语音识别、情感分析、文本摘要等。 随着数据的大量生成和存储,大数据技术已经成为

    2024年04月09日
    浏览(62)
  • Python数据分析—基于机器学习的UCI心脏病数据分析(源码+数据+分析设计)

    下载链接:https://pan.baidu.com/s/1ys2F6ZH4EgnFdVP2mkTcsA?pwd=LCFZ 提取码:LCFZ 心脏病是一类比较常见的循环系统疾病。循环系统由心脏、血管和调节血液循环的神经体液组织构成,循环系统疾病也称为心血管病,包括上述所有组织器官的疾病,在内科疾病中属于常见病,其中以心脏病

    2024年02月07日
    浏览(57)
  • 竞赛 题目:基于大数据的用户画像分析系统 数据分析 开题

    🔥 优质竞赛项目系列,今天要分享的是 基于大数据的用户画像分析系统 该项目较为新颖,适合作为竞赛课题方向,学长非常推荐! 🧿 更多资料, 项目分享: https://gitee.com/dancheng-senior/postgraduate 用户画像是指根据用户的属性、用户偏好、生活习惯、用户行为等信息而抽象出

    2024年02月05日
    浏览(52)
  • [数据分析大全]基于Python的数据分析大全——Numpy基础

    NumPy 的全称为 Numeric Python,它是 Python 的第三方扩展包,主要用来计算、处理一维或多维数组。   步入8月了,7月时因为项目所需,自学了 深度学习 相关的内容,现在 已经把项目所需要的神经网络框架搭建起来了,输入输出也都归一化了,模拟误差也加上了,图像的参数

    2024年02月14日
    浏览(65)
  • 基于Hadoop的数据分析案例-陌陌聊天软件数据分析

    目录 前言 一、使用的工具 二、操作步骤 1.数据来源 2.数据内容分析  3.加载数据  4.数据清洗ETL  5.数据分析 8.数据可视化 本文章是使用基于Hadoop的数据仓库Hive针对陌陌聊天软件进行数据分析并可视化。 Vmware Workstation Pro Centos 7 64bit FinalShell 3.9.2.2 DataGrip 2020.1 x64 Tableau 2021.

    2024年02月06日
    浏览(46)
  • 自然语言处理-情感分析及数据集

    随着在线社交媒体和评论平台的快速发展,大量评论的数据被记录下来。这些数据具有支持决策过程的巨大潜力。  情感分析 (sentiment analysis)研究人们在文本中 (如产品评论、博客评论和论坛讨论等)“隐藏”的情绪。 它在广泛应用于政治(如公众对政策的情绪分析)、

    2024年01月21日
    浏览(59)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包