【时间序列数据挖掘】ARIMA模型

这篇具有很好参考价值的文章主要介绍了【时间序列数据挖掘】ARIMA模型。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

目录

0、前言

一、移动平均模型MA

二、自回归模型AR

三、自回归移动平均模型ARMA

四、自回归移动平均模型ARIMA

【总结】


0、前言

传统时间序列分析模型:

arima时间序列模型,# 大数据,机器学习,人工智能,ARIMA模型,ARIMA,时间序列

ARIMA模型是一个非常灵活的模型,对于时间序列的好多特征都能够进行描述,比如说平稳性特征,季节性特征,趋势性特征。

ARIMA模型可以通过非常成熟的统计方法,比如说极大似然估计,矩估计,贝叶斯估计或者其他一些估计方法得到估计,所以是一个非常好用的工具。

ARIMA模型分成了三部分:AR,I,MA,相当于三个模块的组合。

大家比如说,如果拿到一个时间序列,最想干什么。

如果是一个股票数据,最关心的当然是需要能够知道时刻t~t+h的收益是什么样子的,即期望,arima时间序列模型,# 大数据,机器学习,人工智能,ARIMA模型,ARIMA,时间序列

arima时间序列模型,# 大数据,机器学习,人工智能,ARIMA模型,ARIMA,时间序列

还有方差,作为一个投资者,比如预期我能赚1000万。如果方差是500,那我应该要好好考虑一下我有没有足够的把握能够控制住这个方差,赚到这个1000万。方差不确定性,就能够帮我们甄别做一件事情的风险有多大,计算公式如下:

arima时间序列模型,# 大数据,机器学习,人工智能,ARIMA模型,ARIMA,时间序列

arima时间序列模型,# 大数据,机器学习,人工智能,ARIMA模型,ARIMA,时间序列

平稳时间序列一个随机现象的统计特征不随时间变化而改变的随机过程。

非平稳时间序列: 时间序列自身的随机过程的统计特征随时间改变。

arima时间序列模型,# 大数据,机器学习,人工智能,ARIMA模型,ARIMA,时间序列

一、移动平均模型MA

MA(q):假设一个时间序列由噪音(误差项)以及这些噪音的滞后阶按照不同权重组合起来。计算公式如下:

arima时间序列模型,# 大数据,机器学习,人工智能,ARIMA模型,ARIMA,时间序列

MA(q)是说,yt是和误差项以及误差项的历史阶受影响的。移动平均模型关注的是自回归模型中的误差项的累加。

二、自回归模型AR

 一般的P阶自回归模型 AR:

arima时间序列模型,# 大数据,机器学习,人工智能,ARIMA模型,ARIMA,时间序列

 如果随机扰动项是一个白噪声( ut=εt ),则称为一个纯AR(p)过程,记为:

arima时间序列模型,# 大数据,机器学习,人工智能,ARIMA模型,ARIMA,时间序列

自回归模型AR(p):假设今天的股票收益仅依赖于前天的股票收益,或者是依赖于前p天的股票收益,除此之外不依赖。那么前p天影响到了今天的股票收益。计算公式如下:

arima时间序列模型,# 大数据,机器学习,人工智能,ARIMA模型,ARIMA,时间序列

自回归模型首先需要确定一个阶数p,表示用几期的历史值来预测当前值。

但是,自回归模型有很多的限制:

(1)自回归模型是用自身的数据进行预测;自回归模型描述当前值与历史值之间的关系,用变量自身的历史时间数据对自身进行预测。

(2)时间序列数据必须具有平稳性;

(3)自回归只适用于预测与自身前期相关的现象(时间序列的自相关性);

三、自回归移动平均模型ARMA

可以这样理解,如果你经营一个餐馆,今天餐馆的收益和昨天的收益有关系,同时还受市场上发售的消费券的影响(假设消费券是一个随机数的话)。因为我不知道市场发了多少消费券,所以假定消费券是一个随机数。

arima时间序列模型,# 大数据,机器学习,人工智能,ARIMA模型,ARIMA,时间序列

那么你会发现,那么餐馆的经营既和过去一段时间的业绩有关系,又和消费券的随机数有关系。

那么这两个东西全部综合起来,我们把它叫做自回归移动平均模型ARMA,既有自回归模型AR,又有移动平均模型MA。计算公式如下:

arima时间序列模型,# 大数据,机器学习,人工智能,ARIMA模型,ARIMA,时间序列

ARMA本质上是一个线性模型,但是它非常灵活,它能够帮助我们描述很多不同的场景。由于它是一个递归的形式,可以通过递归的形式来预测yt-1,yt-2,yt-3,所以ARMA模型是一个非常非常有效的基准的时间序列检测工具。

四、自回归移动平均模型ARIMA

现在,我们想想这个“I”是什么东西,“I”是一个差分项。

也就是说任何一个时间序列,你拿到之后,你需要想一想它是不是平稳的。如果不是平稳的,那么我们需要进行差分,即d=1,yt-yt-1就是差分之后的形式。

arima时间序列模型,# 大数据,机器学习,人工智能,ARIMA模型,ARIMA,时间序列

这里的p是自回归模型AR的参数,q是移动平均模型MA的参数,d是指d阶差分。

因为差分后的时间序列往往有更好的平稳性,那么差分后的时间序列就可以更好的用ARMA模型来建模。

ARIMA(p,d,q):假设今天的股票收益不仅依赖于前p天的股票收益,同时还与消费券有关。

除了差分, 比如说还有Box-Jenkins方法,是一个比较主观的工具。但是它对于较长的时间序列不是很好用,然后呢还有一些检验上的问题都很难被处理。

差分:将不平稳的时间序列变平稳。

Box-Jenkins方法:通过查看acf和pcf来识别这个时间序列是不是平稳的。

样本自相关函数(autocorrelation function,ACF):展现t时刻和t-k时刻时间序列的关联性,描述的是时间序列观测值与其过去的观测值之间的线性相关性。

arima时间序列模型,# 大数据,机器学习,人工智能,ARIMA模型,ARIMA,时间序列

样本 偏自相关函数(partial autocorrelation function,PACF) : 在给定了 arima时间序列模型,# 大数据,机器学习,人工智能,ARIMA模型,ARIMA,时间序列的条件下, 𝑦t 与滞后 𝑘 期时间序列之间的条件相关。
 

arima时间序列模型,# 大数据,机器学习,人工智能,ARIMA模型,ARIMA,时间序列

arima时间序列模型,# 大数据,机器学习,人工智能,ARIMA模型,ARIMA,时间序列

PACF描述的是在给定中间观测值的条件下,时间序列观测值预期过去的观测值之间的线性相关性。

举个简单的例子,假设k=3,那么我们描述的是yt和yt-3之间的相关性,但是这个相关性还受到yt-1和yt-2的影响。PACF剔除了这个影响,而ACF包含这个影响。

【总结】

arima时间序列模型,# 大数据,机器学习,人工智能,ARIMA模型,ARIMA,时间序列文章来源地址https://www.toymoban.com/news/detail-732759.html

到了这里,关于【时间序列数据挖掘】ARIMA模型的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【数据挖掘】时间序列教程【四】

            我们可以对上述  的主模型采用方差分析方法,并将中的总变异分解为 为残差平方和和可归因于各种频率的变化。                 第二行是可能的,因为平方的所有交叉项都等于零,即对于所有 ,                                 

    2024年02月12日
    浏览(38)
  • 【数据挖掘】时间序列教程【九】

            状态空间模型通常试图描述具有两个特征的现象 有一个底层系统具有时变的动态关系,因此系统在时间上的“状态”t 与系统在时间的状态t−1有关 .如果我们知道系统在时间上的状态t−1 ,那么我们就有了 我们需要知道的一切 ,以便对当时的状态进行推断或预测

    2024年02月13日
    浏览(31)
  • 【数据挖掘】时间序列教程【十】

    上一节中描述的状态空间模型作为观测方程的更一般的公式            和状态方程                    这里是一个p×1 向量是一个k×1 向量,  是一个p×k 矩阵,  是k×k 矩阵。我们可以想到的和          给定初始状态 和 ,预测方程为(类似于上面)      

    2024年02月15日
    浏览(36)
  • 【数据挖掘】时间序列的傅里叶变换:用numpy解释的快速卷积

            本篇告诉大家一个高级数学模型,即傅里叶模型的使用; 当今,傅里叶变换及其所有变体构成了我们现代世界的基础,为压缩、通信、图像处理等技术提供了动力。我们从根源上理解,从根本上应用,这是值得付出的代价。         傅里叶变换算法被认为是所

    2024年02月16日
    浏览(28)
  • ARIMA模型时间序列数据分析(附python代码)

    ARIMA模型建模流程  1 )平稳性检验与差分处理 我们选取原始数据 bus 中的“ prf_get_person_count ”列,并截取前 32 个站点的数据进行平稳性检验,这里采用的是 ADF 检验确定数据的平稳性,导入 statsmodels 包下的 adfuller 函数,该函数返回 adf 值与概率 p 值。若原始序列不平稳,就

    2024年02月01日
    浏览(42)
  • 时间序列ARIMA模型

    ARIMA模型的全称叫做自回归移动平均模型,全称是(ARIMA,Autoregressive Integrated Moving Average Model)。也记作ARIMA(p,d,q),是统计模型(statisticmodel)中最常见的一种用来进行时间序列预测的模型。 将非平稳时间序列转化为平稳时间序列然后将因变量仅对它的滞后值以及随机误差项的现值和

    2024年02月03日
    浏览(37)
  • 时间序列模型-ARIMA

    描述当前值与历史值之间的关系,用变量自身的历史数据对自身进行预测; 自回归模型必须满足平稳性的要求;(何为平稳性:见时间序列数据分析基本概念) p阶自回归过程的公式定义:         其中是当前值,是常数项,p是阶数,是自相关系数,是误差。 1.1.1 自回归

    2023年04月08日
    浏览(75)
  • 时间序列模型算法 - ARIMA (一)

    时间序列是研究数据随时间变化而变化的一种算法。是一种预测性分析算法。它的基本出发点就是事物发展都有连续性,按照它本身固有的规律进行。 时间序列的常用算法包括: 有这几个那如何选择模型呢 首先我们要知道时间序列就是按照时间顺序排列,随时间变化的随机

    2023年04月27日
    浏览(44)
  • 时间序列预测 | Matlab自回归差分移动平均模型ARIMA时间序列预测

    效果一览 文章概述 时间序列预测 | Matlab自回归差分移动平均模型ARIMA时间序列预测,单列数据输入模型 评价指标包括:MAE、RMSE和R2等,代码质量极高,方便学习和替换数据。要求2018版本及以上。 部分源码

    2024年02月13日
    浏览(40)
  • Python时间序列分析--ARIMA模型实战案例

    **本文将介绍使用Python来完成时间序列分析ARIMA模型的完整步骤与流程,绘制时序图,平稳性检验,单位根检验,白噪声检验,模型定阶,参数估计,模型检验等完整步骤。Python建立时间序列分析–ARIMA模型实战案例 时间序列指的是将带有同一指标单位的数值按照产生时间的先

    2024年01月17日
    浏览(37)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包