WPS数据清洗+R语言读取文件画频数分布直方图

这篇具有很好参考价值的文章主要介绍了WPS数据清洗+R语言读取文件画频数分布直方图。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

R语言是一门好语言,但很多人在读取文件中数据时会遇到问题。比如我遇到的问题就是从文件中读取数据后,数据无法用于画图。

检索了N篇博文(抱歉我实在无法一一列举30+篇博文)后,终于看到曙光,事实告诉我学任何一门语言都需要至少投资一本教材(譬如《R语言编程艺术》(美)Norman Matloff著,陈堰平、邱怡轩、潘岚锋 等译)。

下面展示一个栗子:

D市每日接电话报警数已知,求何时警情比较集中?

这明摆着是个统计问题,频数分布直方图就能完美解决。

鉴于并不是所有Office软件都支持直接画频数分布直方图,我想到了大学时代刘苗老师教我们的现代统计软件课——没错,就是R。

R语言在于短小精悍且图形优美,感觉就是统计软件界的python嘛!

下面开始:

1.数据清洗 

为了便于技术分享,我将数据脱敏。去掉接报警详细内容,只保留接报警时间一列:

WPS数据清洗+R语言读取文件画频数分布直方图,仰望IT天空——R,r语言,开发语言,wps,绘图

图片只截取了一部分,日期是从2023-05-01到2023-05-31的,我们统计的是每日接报警集中情况,所以应将日期元素清洗掉。该怎么办呢?

这里康妮猫用了一个比较讨巧的做法:分列

WPS数据清洗+R语言读取文件画频数分布直方图,仰望IT天空——R,r语言,开发语言,wps,绘图

是的,就是WPS自带的分列功能,可以将每一行“日期+时间”的数据拆分开。得到下图:(左列40000多是用WPS自带的格式转换为数据后得到的,右边是我们提取的时间数据)

WPS数据清洗+R语言读取文件画频数分布直方图,仰望IT天空——R,r语言,开发语言,wps,绘图

  将无用的左列删掉,再用WPS自带的格式转换将时间数据转换为小数。

 WPS数据清洗+R语言读取文件画频数分布直方图,仰望IT天空——R,r语言,开发语言,wps,绘图

2.数据读取

getwd()#获取工作空间地址
setwd("D:/data")#设置工作空间地址

times=read.table("ds2023May.txt")#把WPS里的数据复制粘贴到记事本,读取
typeof(times)#检验数据类型,发现是“list”

times=as.numeric(unlist(times))#这一步非常重要,接下来就可以操作咯

一定要用unlist()函数,否则读取的数据无法用于画图。发现其他方式的小伙伴一定要留言告诉我!

3.画图

hist(times)#这句虽然能出图,但横坐标不对,我们来个操作
hist(times*24)

hist(times*24,xlab="h",ylab="人次",main="XX区5月电话报警峰谷图",sub="制图:Connie",xlim=c(0,25),ylim=c(0,500),col="blue",xaxt="n",yaxt="n")#这句出来个没坐标的图

执行代码,画出无坐标的图(因为我们要个性化坐标: ))

WPS数据清洗+R语言读取文件画频数分布直方图,仰望IT天空——R,r语言,开发语言,wps,绘图

 

 hist(times*24,xlab="h",ylab="人次",main="X区5月电话报警峰谷图",sub="制图:Connie",xlim=c(0,25),ylim=c(0,500),col="blue",xaxt="n",yaxt="n")#
axis(1,a)
axis(2,b)

WPS数据清洗+R语言读取文件画频数分布直方图,仰望IT天空——R,r语言,开发语言,wps,绘图

 如图所示,每日接报警情自6时起至8时不断增加,到中午12至13时有所下降,后上升至19时达到最高后又逐步下降。(我这个分析= =#仅供参考)

4.总结

a.前期数据清洗很重要。不然就会困死在一条代码上拔不出来。要灵活利用WPS自带的功能为我们减少工作负担~(别问我自动化水平降低怎么破,那是大神们的事)

b.画图要循序渐进,不要指望一条代码就解决整张图。

c.unlist()函数很重要,如果实在不知道数据类型就用typeof()查一查,秒懂!

好啦今天的分享就到这里,热爱Coding的你们,再会!文章来源地址https://www.toymoban.com/news/detail-519100.html

到了这里,关于WPS数据清洗+R语言读取文件画频数分布直方图的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • [][R语言]股票分析实战[11]:读取股票数据文件的细节: 提取目标列数据

    [简介] 常用网名: 猪头三 出生日期: 1981.XX.XX QQ联系: 643439947 个人网站: 80x86汇编小站 https://www.x86asm.org 编程生涯: 2001年~至今[共22年] 职业生涯: 20年 开发语言: C/C++、80x86ASM、PHP、Perl、Objective-C、Object Pascal、C#、Python 开发工具: Visual Studio、Delphi、XCode、Eclipse、C++ Builder 技能种类

    2024年01月21日
    浏览(32)
  • [][R语言]股票分析实战[10]:读取股票数据文件的细节: 数值精度丢失 和 排序

    [简介] 常用网名: 猪头三 出生日期: 1981.XX.XX QQ联系: 643439947 个人网站: 80x86汇编小站 https://www.x86asm.org 编程生涯: 2001年~至今[共22年] 职业生涯: 20年 开发语言: C/C++、80x86ASM、PHP、Perl、Objective-C、Object Pascal、C#、Python 开发工具: Visual Studio、Delphi、XCode、Eclipse、C++ Builder 技能种类

    2024年01月23日
    浏览(35)
  • R语言学习笔记之数据清洗与整理(三)

    提高 1.查看数据前三行 head(df,3)或 slice_head(n=3) 2.查看每列数据缺失情况 is.na(df)#适用于小数据 sum(is.na()) table(is.na())#只能知道缺失值的个数并不知道每一列(即每个变量)缺失数据的情况 (1)miss-function(x){sum(is.na(x)/length(x)*100)} apply(数据集,2,rate)#2是按列算rate的意思 (2)libr

    2023年04月19日
    浏览(27)
  • C语言数据结构课设:矩阵的运算(转置.求和.求差.矩阵相乘.求逆.数乘),文件读取矩阵

      #include stdio.h #include string.h #includestdlib.h #includemath.h // 定义一个结构体类型,表示一个矩阵 typedef struct matrix {     int nrow; // 矩阵的行数     int ncol; // 矩阵的列数     double data[10][10]; // 矩阵的数据,最大为 10 x 10 } matrix; // 定义一个函数,用于显示一个矩阵的内容  void dis

    2024年03月27日
    浏览(44)
  • R语言 | GEO表达矩阵的数据清洗与预处理

    目录 1.去除/// 2.去除重复的基因名 3.表达矩阵自动log2化 4.矫正差异 表达量矩阵的数据清洗应该在 注释完成之后 进行,并且下列操作最好按顺序进行 如下图的表格所示,同一个探针ID对应的gene有多个,用///分隔着,而我们想获得一个探针ID只对应一个基因symbol的表格。 表达

    2024年02月13日
    浏览(28)
  • 如何绘制出图像的色素分布直方图

    如图,可以展示出我们的图像的颜色分布直方图,表明的图像的亮和暗 这里我们对我们的灰色图片和彩色图片进行了直方图显示 注意:记得下载 上面代码里面的color=\\\'b\\\'表示我们的直方图是蓝色的,这里可以用b代表blue 会出现这样一个程序 显示的直方图 加入了 效果:

    2024年01月18日
    浏览(25)
  • R语言【utils】——read.table():以表格式读取文件,并从中创建一个数据帧,其中大小写对应于行,变量对应于文件中的字段。

    Package  utils  version 4.2.0 参数【file】 :要从中读取数据的文件的名称。表的每一行为文件的一行。如果不包含绝对路径,则文件名相对于当前工作目录 getwd() 。在支持的地方执行波浪运算符扩展。这可以是一个压缩文件。或者, 参数【file】 可以是一个可读的文本模式连接

    2024年02月02日
    浏览(35)
  • python中利用seaborn绘制概率分布直方图以及密度图

    当我们想要弄清楚变量的统计特性时,往往想知道它是服从什么分布的,这时候就需要绘制概率分布直方图 在python中我们可以使用 seaborn 库来进行绘制: Seaborn是一个基于matplotlib的Python数据可视化库。它为绘制有吸引力和信息丰富的统计图形提供了高级界面。 首先需要导入

    2024年02月16日
    浏览(42)
  • Qt之基于QCustomPlot绘制直方图(Histogram),叠加正态分布曲线

    高斯分布(Gaussian distribution),又名正态分布(Normal distribution),也称\\\"常态分布\\\",也就是说,在正常的状态下,一般的事物,都会符合这样的分布规律。 比如人的身高为一个随机变量,特别高的人比较少,特别矮的也很少,大部分都集中在中等身高。 人的智商也是如此,社会精

    2024年02月06日
    浏览(43)
  • 【图论】计算图的n-hop邻居个数,并绘制频率分布直方图

    在图论中,n-hop邻居(或称为K-hop邻居)是指从某个顶点出发,通过最短路径(即最少的边数)可以到达的所有顶点的集合,其中n(或K)是这个最短路径的长度。换句话说,n-hop邻居就是在图中,从一个顶点出发,经过n步可以到达的所有顶点。 举个日常生活中的例子,我们的

    2024年04月28日
    浏览(30)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包