[][R语言]股票分析实战[10]:读取股票数据文件的细节: 数值精度丢失 和 排序

这篇具有很好参考价值的文章主要介绍了[][R语言]股票分析实战[10]:读取股票数据文件的细节: 数值精度丢失 和 排序。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

[简介]
常用网名: 猪头三
出生日期: 1981.XX.XX
QQ联系: 643439947
个人网站: 80x86汇编小站 https://www.x86asm.org
编程生涯: 2001年~至今[共22年]
职业生涯: 20年
开发语言: C/C++、80x86ASM、PHP、Perl、Objective-C、Object Pascal、C#、Python
开发工具: Visual Studio、Delphi、XCode、Eclipse、C++ Builder
技能种类: 逆向 驱动 磁盘 文件
研发领域: Windows应用软件安全/Windows系统内核安全/Windows系统磁盘数据安全/macOS应用软件安全
项目经历: 磁盘性能优化/文件系统数据恢复/文件信息采集/敏感文件监测跟踪/网络安全检测

[序言]
R语言中, 按行读取文件数据的时候, 如果数据存在多列, 最好为每一列指定类型, 不然R语言在解释数值类型会出现偏差.  另外, 股票数据加载之后, 你可能会进行多次处理, 比如rbind, cbind这类操作, 导致股票数据日期乱序了, 那么就需要重排.

[正确的加载数据方式, 解决数据精度丢失 和 排序]
比如, 有一个股票数据文件"002431-棕榈股份.txt", 内容如下:

20231229|2.47|2.54|2.65|2.44|517517.44
20231228|2.38|2.47|2.48|2.34|316899.00
20231227|2.34|2.42|2.53|2.33|362926.00
20231226|2.36|2.33|2.37|2.32|90035.00
20231225|2.39|2.35|2.39|2.34|130358.50
20231222|2.44|2.39|2.45|2.38|120876.00
20231221|2.42|2.44|2.45|2.38|112654.70
20231220|2.46|2.42|2.47|2.42|92011.03
20231219|2.46|2.45|2.48|2.43|95427.02
20231218|2.50|2.47|2.54|2.46|137959.81
20231215|2.53|2.51|2.55|2.50|104274.00
20231214|2.50|2.52|2.54|2.50|135652.00
20231213|2.51|2.50|2.55|2.49|138082.00
20231212|2.48|2.51|2.51|2.46|144266.50

这个数据, 有6列, 然后需要设定每列数据类型: "integer", "numeric", "numeric", "numeric", "numeric", "numeric", 然后按照第1列日期数据进行排序

#加载股票数据文件
stock_demo <- read.table("002431-棕榈股份.txt", sep = "|", colClasses = c("integer", "numeric", "numeric", "numeric", "numeric", "numeric"))

# 为数据列起标题
names(stock_demo)[1:6] <- c("Date", "O", "C", "H", "L", "VOL")

# 按照日期进行排序
stock_Data_Test <- stock_demo[order(stock_demo$Date),] # 升序
stock_Data_Test <- stock_demo[order(-stock_demo$Date),] # 降序

[结尾]
上面的代码操作细节, 是非常重要的, 如果数据加载出现丢失或者偏差, 会导致后期大数据分析或者建模的准确性降低.文章来源地址https://www.toymoban.com/news/detail-818697.html

到了这里,关于[][R语言]股票分析实战[10]:读取股票数据文件的细节: 数值精度丢失 和 排序的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • WPS数据清洗+R语言读取文件画频数分布直方图

    R语言是一门好语言,但很多人在读取文件中数据时会遇到问题。比如我遇到的问题就是从文件中读取数据后,数据无法用于画图。 检索了N篇博文(抱歉我实在无法一一列举30+篇博文)后,终于看到曙光,事实告诉我学任何一门语言都需要至少投资一本教材(譬如《R语言编程

    2024年02月12日
    浏览(39)
  • 二十三、SQL 数据分析实战(10个简单的SQL题目)

    现有一张参加比赛的队伍名称表 easy_competition_list,easy_competition_list 表的数据如下所示: 【题目1】每个参赛队伍都会和其他参赛队伍开展一次组队比赛,要求输出两两参赛队伍的所有比赛情况组合(两者分别为队伍A和队伍B),并按照队名依次升序排列。输出内容包括:队伍

    2024年02月11日
    浏览(58)
  • 【Alibaba工具型技术系列】「EasyExcel技术专题」实战研究一下 EasyExcel 如何从指定文件位置进行读取数据

    EasyExcel的使用背景 工作中总会遇到对Excel读写功能,之前接触过EasyExcel,后续我们基本上用它代替了传统的POI和JXL、甚至还有一个EasyPOI技术。 EasyExcel的时候痛点 使用的EasyExcel时候,一般场景下表头比较传统,也不复杂,但是这次呢表头稍微有点复杂,读取数据要从指定的位

    2024年01月21日
    浏览(45)
  • C语言数据结构课设:矩阵的运算(转置.求和.求差.矩阵相乘.求逆.数乘),文件读取矩阵

      #include stdio.h #include string.h #includestdlib.h #includemath.h // 定义一个结构体类型,表示一个矩阵 typedef struct matrix {     int nrow; // 矩阵的行数     int ncol; // 矩阵的列数     double data[10][10]; // 矩阵的数据,最大为 10 x 10 } matrix; // 定义一个函数,用于显示一个矩阵的内容  void dis

    2024年03月27日
    浏览(58)
  • 用python做股票数据分析

    本文我们一起用python来对某只股票的所有历史日数据,做一个探索性的分析,看看能不能有一些有趣的发现,希望能激起你对金融数据分析的兴趣。主要用到numpy,pandas模块的一些基本用法。本文的所有数据,包含所有A股的日数据,在文末有下载。 我们先导入需要的模块,然

    2024年02月08日
    浏览(34)
  • 看书标记【R语言数据分析项目精解:理论、方法、实战 9】

    【R语言数据分析项目精解:理论、方法、实战 9】 9.1项目背景、目标和方案 9.1.1项目背景 评论内容无效、评论数据千人一面,有必要对评论显示策略做出一定的调整 9.1.2项目目标 (1)对评论文本的质量进行监控和量化,将一些无效评论的显示顺序滞后。 (2)制定用户相似度

    2024年01月22日
    浏览(49)
  • 项目分享:大数据股票数据可视化分析与预测系统

    股票市场行情分析与预测是数据分析领域里面的重头戏,其符合大数据的四大特征:交易量大、频率高、数据种类多、价值高。 本项目基于 Python 利用网络爬虫技术从某财经网站采集上证指数、创业板指数等大盘指数数据,以及个股数据,同时抓取股票公司的简介、财务指标

    2024年02月04日
    浏览(43)
  • 基于大数据的股票数据可视化分析与预测系统

    温馨提示:文末有 CSDN 平台官方提供的学长 QQ 名片 :)          股票市场行情分析与预测是数据分析领域里面的重头戏,其符合大数据的四大特征:交易量大、频率高、数据种类多、价值高。本项目基于 Python 利用网络爬虫技术从某财经网站采集上证指数、创业板指数等大

    2024年01月17日
    浏览(59)
  • Spark大数据分析与实战笔记(第一章 Scala语言基础-2)

    Spark是专为大规模数据处理而设计的快速通用的计算引擎,它是由Scala语言开发实现的,关于大数据技术,本身就是计算数据,而Scala既有面向对象组织项目工程的能力,又具备计算数据的功能,同时Spark和Scala的紧密集成,本书将采用Scala语言开发Spark程序,所以学好Scala将有助

    2024年02月11日
    浏览(62)
  • Spark大数据分析与实战笔记(第一章 Scala语言基础-3)

    对于每一门编程语言来说,数组(Array)都是重要的数据结构之一,主要用来存储数据类型相同的元素。Scala中的数组分为定长数组和变长数组,定义定长数组,需要使用new,而定义变长数组时,则需要导包 import scala.collection.mutable.ArrayBuffer 。 数组(Array)主要用来存储

    2024年02月10日
    浏览(64)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包