Informer时序模型(自定义项目)

这篇具有很好参考价值的文章主要介绍了Informer时序模型(自定义项目)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

开源项目

说明

  • 读完代码解析篇,我们针对开源项目中的模型预测方法做一下介绍。作者在Github上给出了模型预测方法以及Q、K图的做法,这里提供下载链接
  • 首先,在不更改任何参数的情况下跑完代码,会在项目文件夹中生成两个子文件夹
  • checkpoints文件夹中包含训练完成的模型,后缀名为.pth,该模型文件包含完整的模型架构与各层权重,可以通过torch.load函数加载模型
  • results文件夹中包含metrics.npypred.npytrue.npy三个文件,pred.npy表示模型预测值,true.npy表示序列真实值
  • 我们可以先将pred.npytrue.npy文件作图进行对比,观察模型效果
setting = 'informer_power data_ftMS_sl96_ll48_pl24_dm512_nh8_el2_dl1_df2048_atprob_fc5_ebtimeF_dtTrue_mxTrue_exp_0'
pred = np.load('./results/'+setting+'/pred.npy')
true = np.load('./results/'+setting+'/true.npy')
print(pred.shape)
print(true.shape)

import matplotlib.pyplot as plt
plt.figure()
plt.plot(true[0,:,-1], label='GroundTruth')
plt.plot(pred[0,:,-1], label='Prediction')
plt.legend()
plt.show()

输出:
使用informer训练自己的数据集,python,深度学习,机器学习文章来源地址https://www.toymoban.com/news/detail-789894.html

  • 如果想要得到模型对后面时间序列的预测值,有2种方式:
    • 第1种:在pycharm模型训练之前将参数'--do_predict''store_true'变为'store_false',这样在代码运行完以后results文件夹中会多出一个文件real_prediction.npy,该文件中即是模型预测的序列值。
    • 第2种:在模型训练完以后(在jupyter notebook)中使用exp.predict(setting, True)得到预测值
      输出
      使用informer训练自己的数据集,python,深度学习,机器学习

在Kaggle上使用

  • 在Kaggle上我们可以使用免费的GPU来训练模型,达到加速效果,这里把作者的代码解析一遍。

下载项目文件

!git clone https://github.com/zhouhaoyi/Informer2020.git
!git clone https://github.com/zhouhaoyi/ETDataset.git
!ls

导入包

from utils.tools import dotdict
import matplotlib.pyplot as plt
from exp.exp_informer import Exp_Informer
import torch

参数传导

  • 这个地方与在pycharm中不一样,请注意!
args = dotdict()

args.model = 'informer' # model of experiment, options: [informer, informerstack, informerlight(TBD)]

args.data = 'ETTh1' # data
args.root_path = './ETDataset/ETT-small/' # root path of data file
args.data_path = 'ETTh1.csv' # data file
args.features = 'M' # forecasting task, options:[M, S, MS]; M:multivariate predict multivariate, S:univariate predict univariate, MS:multivariate predict univariate
args.target = 'OT' # target feature in S or MS task
args.freq = 'h' # freq for time features encoding, options:[s:secondly, t:minutely, h:hourly, d:daily, b:business days, w:weekly, m:monthly], you can also use more detailed freq like 15min or 3h
args.checkpoints = './informer_checkpoints' # location of model checkpoints

args.seq_len = 96 # input sequence length of Informer encoder
args.label_len = 48 # start token length of Informer decoder
args.pred_len = 24 # prediction sequence length
# Informer decoder input: concat[start token series(label_len), zero padding series(pred_len)]

args.enc_in = 7 # encoder input size
args.dec_in = 7 # decoder input size
args.c_out = 7 # output size
args.factor = 5 # probsparse attn factor
args.d_model = 512 # dimension of model
args.n_heads = 8 # num of heads
args.e_layers = 2 # num of encoder layers
args.d_layers = 1 # num of decoder layers
args.d_ff = 2048 # dimension of fcn in model
args.dropout = 0.05 # dropout
args.attn = 'prob' # attention used in encoder, options:[prob, full]
args.embed = 'timeF' # time features encoding, options:[timeF, fixed, learned]
args.activation = 'gelu' # activation
args.distil = True # whether to use distilling in encoder
args.output_attention = False # whether to output attention in ecoder
args.mix = True
args.padding = 0
args.freq = 'h'

args.batch_size = 32 
args.learning_rate = 0.0001
args.loss = 'mse'
args.lradj = 'type1'
args.use_amp = False # whether to use automatic mixed precision training

args.num_workers = 0
args.itr = 1
args.train_epochs = 6
args.patience = 3
args.des = 'exp'

args.use_gpu = True if torch.cuda.is_available() else False
args.gpu = 0

args.use_multi_gpu = False
args.devices = '0,1,2,3'

检查GPU

args.use_gpu = True if torch.cuda.is_available() and args.use_gpu else False

if args.use_gpu and args.use_multi_gpu:
    args.devices = args.devices.replace(' ','')
    device_ids = args.devices.split(',')
    args.device_ids = [int(id_) for id_ in device_ids]
    args.gpu = args.device_ids[0]

定义数据加载

# Set augments by using data name
data_parser = {
    'ETTh1':{'data':'ETTh1.csv','T':'OT','M':[7,7,7],'S':[1,1,1],'MS':[7,7,1]},
    'ETTh2':{'data':'ETTh2.csv','T':'OT','M':[7,7,7],'S':[1,1,1],'MS':[7,7,1]},
    'ETTm1':{'data':'ETTm1.csv','T':'OT','M':[7,7,7],'S':[1,1,1],'MS':[7,7,1]},
    'ETTm2':{'data':'ETTm2.csv','T':'OT','M':[7,7,7],'S':[1,1,1],'MS':[7,7,1]},
}
if args.data in data_parser.keys():
    data_info = data_parser[args.data]
    args.data_path = data_info['data']
    args.target = data_info['T']
    args.enc_in, args.dec_in, args.c_out = data_info[args.features]

训练模型

args.detail_freq = args.freq
args.freq = args.freq[-1:]
Exp = Exp_Informer

for ii in range(args.itr):
    # setting record of experiments
    setting = '{}_{}_ft{}_sl{}_ll{}_pl{}_dm{}_nh{}_el{}_dl{}_df{}_at{}_fc{}_eb{}_dt{}_mx{}_{}_{}'.format(args.model, args.data, args.features, 
                args.seq_len, args.label_len, args.pred_len,
                args.d_model, args.n_heads, args.e_layers, args.d_layers, args.d_ff, args.attn, args.factor, args.embed, args.distil, args.mix, args.des, ii)

    # set experiments
    exp = Exp(args)
    
    # train
    print('>>>>>>>start training : {}>>>>>>>>>>>>>>>>>>>>>>>>>>'.format(setting))
    exp.train(setting)
    
    # test
    print('>>>>>>>testing : {}<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<'.format(setting))
    exp.test(setting)

    torch.cuda.empty_cache()
  • 到这里模型训练完毕

预测

  • 运行完会在results文件夹中生成real_prediction.npy序列预测数据
import os
setting = 'informer_ETTh1_ftM_sl96_ll48_pl24_dm512_nh8_el2_dl1_df2048_atprob_fc5_ebtimeF_dtTrue_mxTrue_exp_0'
exp = Exp(args)
exp.predict(setting, True)

prediction = np.load('./results/'+setting+'/real_prediction.npy')
plt.figure()
plt.plot(prediction[0,:,-1], label='Prediction')
plt.legend()
plt.show()

自定义项目

数据处理

  • 首先将数据集放入项目data文件夹中,然后修改'--data''--root_path''--data_path''--data_path'参数。
  • 比如在这里,我使用的是power data.csv数据集(下载链接),那么我的参数应该修改成这样:
parser.add_argument('--data', type=str, default='power data')
parser.add_argument('--root_path', type=str, default='./data/')
parser.add_argument('--data_path', type=str, default='power data.csv')
  • 然后修改预测类型,这里我使用多变量预测单变量,所以--features参数选择MS;预测的变量名称为总有功功率,所以修改'--target'参数;时间采样为15分钟,所以将'--freq'参数改为t即:
parser.add_argument('--features', type=str, default='MS')
parser.add_argument('--target', type=str, default='总有功功率')
parser.add_argument('--freq', type=str, default='t')
  • 我想序列长度为192(2天),有标签预测序列长度为96(1天),无标签预测序列长度为48(半天),修改参数'--seq_len''--label_len''--pred_len'为:
parser.add_argument('--seq_len', type=int, default=192)
parser.add_argument('--label_len', type=int, default=96)
parser.add_argument('--pred_len', type=int, default=48)
  • 接下来跳到数据处理方式data_parser,参照项目原有处理方式进行填写:
data_parser = {'power data':{'data':'power data.csv','T':'总有功功率','M':[5,5,5],'S':[1,1,1],'MS':[5,5,1]},
}
  • 找到exp_informer.py文件,_get_data类中data_dict参数,使用Dataset_Custom对数据进行处理,即:
data_dict = {'power data':Dataset_Custom,}
  • 到这里数据处理修改结束

模型参数

  • 这里我希望模型运行结束后生成预测序列文件,所以我将'--do_predict'参数修改为'store_false',即:
parser.add_argument('--do_predict', action='store_false')
  • 其他参数,比如学习率等等,大家可以根据任务要求自行修改,这里我就不再赘述了。

在Kaggle上使用

  • 将项目放在Kaggle上使用GPU加速运算,这里我将基于此数据的Kaggle项目分享给大家,大家可以参照我的项目搭建自己的模型。

到了这里,关于Informer时序模型(自定义项目)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Pycharm里配置Pytorch-gpu(运行informer算法模型)

    1.下载Anaconda安装包 去官网 https://www.anaconda.com/download下载适合自己操作系统的Anaconda安装包。 (以Windows为例) 2.安装Anaconda 双击下载后的“Anaconda3-2023.09-0-Windows-x86_64.exe”,进行安装。点击“Next”。  选择安装路径,最好选择C盘以外的路径。 选择“安装选项”,根据自己的

    2024年02月03日
    浏览(45)
  • 深入源码分析kubernetes informer机制(零)简单了解informer

    [阅读指南] 基于kubernetes 1.27 stage版本 为了方便阅读,后续所有代码均省略了错误处理及与关注逻辑无关的部分。 client-go是kubernetes节点与服务端进行资源交互的客户端库,提供了非常多的功能与组件,用来与Kubernetes API 进行交互与操作。常见的功能有管理和同步kubernetes资源、

    2024年02月12日
    浏览(40)
  • 自定义的卷积神经网络模型CNN,对图片进行分类并使用图片进行测试模型-适合入门,从模型到训练再到测试,开源项目

    自定义的卷积神经网络模型CNN,对图片进行分类并使用图片进行测试模型-适合入门,从模型到训练再到测试:开源项目 开源项目完整代码及基础教程: 资料获取,关注公众号【一起来学习哟】获取 CNN模型: 1.导入必要的库和模块: torch:PyTorch深度学习框架。 torchvision:P

    2024年02月06日
    浏览(47)
  • 深入源码分析kubernetes informer机制(三)Resync

    [阅读指南] 这是该系列第三篇 基于kubernetes 1.27 stage版本 为了方便阅读,后续所有代码均省略了错误处理及与关注逻辑无关的部分。 如果看过上一篇,大概能了解,client数据主要通过reflector 的list/watch进行同步。 回顾一下informer整体的数据同步逻辑。 informer初始化时,调用l

    2024年02月12日
    浏览(36)
  • 深入源码分析kubernetes informer机制(二)Reflector

    [阅读指南] 这是该系列第二篇 基于kubernetes 1.27 stage版本 为了方便阅读,后续所有代码均省略了错误处理及与关注逻辑无关的部分。 reflector在informer中就像是一个对外的窗口,它与api-server建立连接,监听和获取来自api-server的资源变化信息,并把这些信息放进deltaFIFO中,交给下

    2024年02月12日
    浏览(41)
  • 深入源码分析kubernetes informer机制(四)DeltaFIFO

    [阅读指南] 这是该系列第四篇 基于kubernetes 1.27 stage版本 为了方便阅读,后续所有代码均省略了错误处理及与关注逻辑无关的部分。 如下图,clinet-go中定义了存储类型接口store,用来提供存储对象的基本能力。 queue继承了store接口,并提供了队列的能力,队列中可以保存需要增

    2024年02月13日
    浏览(37)
  • K8S Informer机制原理解读 | 架构设计

    在Kubernetes系统中,组件之间通过HTTP协议进行通信,在不依赖任何中间件的情况下需要保证消息的实时性、可靠性、顺序性等。那么Kubernetes是如何做到的呢?答案就是Informer机制。Kubernetes的其他组件都是通过client-go的Informer机制与Kubernetes API Server进行通信的。 在Informer架构设

    2024年01月22日
    浏览(49)
  • Informer:比Transformer更有效的长时间序列预测

    目录 AAAI 2021最佳论文:比Transformer更有效的长时间序列预测 Background Why attention ​编辑​编辑​编辑 Methods:the details of Informer Solve_Challenge_1:最基本的一个思路就是降低Attention的计算量,仅计算一些非常重要的或者说有代表性的Attention即可,一些相近的思路在近期不断的提出,

    2023年04月09日
    浏览(60)
  • AAAI最佳论文Informer 复现(含python notebook代码)

    Github论文源码 由于很菜,零基础看源码的时候喜欢按照代码运行的顺序来跑一遍一个batch,从外层一点点拆进去,看代码内部的逻辑。最初复现的时候大部分都沿用args里的default,后面再尝试改用自己的数据+调参(哈哈至今也无法参透调参的这部分,希望不是玄学。。。) 记

    2024年02月20日
    浏览(43)
  • 时间序列预测算法梳理(Arima、Prophet、Nbeats、NbeatsX、Informer)

    自回归滑动平均(Autoregressive integrated moving average,ARIMA)模型由Box和Jenkins于1970年提出。他们认为 某些非平稳序列中,某一部分与其他部分相似,而这种同质性可经d阶差分后就可以成为平稳序列 ,成为混合自回归-滑动平均过程。那么该非平稳序列为ARIMA模型,用 表示。其中

    2024年02月06日
    浏览(43)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包