Pytorch Lightning 训练更新次数

这篇具有很好参考价值的文章主要介绍了Pytorch Lightning 训练更新次数。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

假设一共1000个samples,batch size=4,因此一个epoch会有250 iterations,也就是会更新250次

当设置Trainer时

trainer = pl.Trainer(gpus=1, precision=32, callbacks=[logger], max_steps=40, accumulate_grad_batches=2)

这个max_steps指的是最多更新的次数,这里也就是40次,而accumulate_grad_batches指的是每次更新前积累多少个batch,这里为2

因此,每次更新前实际上积累了2 * 4 = 8个samples的gradients(当然是取了平均),而最多更新40次,因此最后训练完看到完成的iterations则是80,因为两个iterations被积累到一起来更新

注意:不论这个max_stepsaccumulate_grad_batches是多少,训练时显示的log永远都是正常训练(无梯度累计)时的样子

Epoch 0:  32%|| 80/250 [02:41<05:39,  2.00s/it, loss=0.85, v_num=15, train/loss_simple_step=0.820, train/loss_v

即,这个250不会因为我们要累计两个batches而变成125,而是保持为250,且训练完后可以看到完成了80个iterations

默认情况下,Pytorch Lightning在每个epoch结束后,会保存一次模型,每个epoch包含多少iterations是固定的,不会因为max_stepsaccumulate_grad_batches的改变而改变,在上面的例子中即250。在最后一次更新完成后也会保存一次模型,不论是在epoch末尾还是中间。

值得注意的是,一个epoch后保存下载的模型的名称

epoch=0-step=124.ckpt

这个step代表的是目前为止一共更新的次数,而不是iterations的数量。比如这个在epoch0结束后保存的模型,一共经历了125个更新steps,而每次step其实积累了两个batch,即两个iterations.

还需注意,默认情况Pytorch Lightning只会保存最新的model,然后会删掉之前保存的旧的model文章来源地址https://www.toymoban.com/news/detail-550921.html

到了这里,关于Pytorch Lightning 训练更新次数的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • PyTorch深度学习实战(5)——计算机视觉

    计算机视觉是指通过计算机系统对图像和视频进行处理和分析,利用计算机算法和方法,使计算机能够模拟和理解人类的视觉系统。通过计算机视觉技术,计算机可以从图像和视频中提取有用的信息,实现对环境的感知和理解,从而帮助人们解决各种问题和提高效率。本节中

    2024年02月15日
    浏览(49)
  • 【计算机视觉】YOLO 入门:训练 COCO128 数据集

    我们以最近大热的YOLOv8为例,回顾一下之前的安装过程: 这里选择训练的数据集为:COCO128 COCO128是一个小型教程数据集,由COCOtrain2017中的前128个图像组成。 在YOLO中自带的coco128.yaml文件: 1)可选的用于自动下载的下载命令/URL, 2)指向培训图像目录的路径(或指向带有培训

    2024年02月10日
    浏览(48)
  • PyTorch深度学习实战(5)——计算机视觉基础

    计算机视觉是指通过计算机系统对图像和视频进行处理和分析,利用计算机算法和方法,使计算机能够模拟和理解人类的视觉系统。通过计算机视觉技术,计算机可以从图像和视频中提取有用的信息,实现对环境的感知和理解,从而帮助人们解决各种问题和提高效率。本节中

    2024年02月16日
    浏览(41)
  • 动手学CV-Pytorch计算机视觉 天池计算机视觉入门赛SVHN数据集实战

    这里我们以datawhale和天池合作的天池计算机视觉入门赛为例,通过案例实战来进一步巩固本章所介绍的图像分类知识。 该比赛以SVHN街道字符为赛题数据,数据集报名后可见并可下载,该数据来

    2024年02月04日
    浏览(46)
  • [汇总]计算机专业相关证书大全(持续更新...)

    所有数据 来源于网络 , 每个证书数据来源会附在小节标题后 。文章内容 仅作参考 , 没有任何培训广告 。 笔者 只负责搜集整理 ,对于 各证书含金量不做评价 。证书排序 按照收集的顺序 , 没有任何排名 。 内容会 尽量保持持续更新 。由于能力有限,难免出现各种错误

    2024年02月04日
    浏览(58)
  • 计算机组成原理笔记(王道考研)(持续更新)

    本文是对王道计算机考研《计算机组成原理》课程的总结,主讲咸鱼学长讲的确实清晰。 王道考研《计算机组成原理》 由于我们学校已经开设过汇编和计算机体系结构,所以计组的笔记内容会比较精炼,高屋建瓴,不适合无基础人听。 如果有不理解的,可以回去看看我前面

    2024年02月08日
    浏览(56)
  • 【计算机视觉中的 GAN 】如何稳定GAN训练(3)

        在上 一篇文章 中,我们达到了理解未配对图像到图像翻译的地步。尽管如此,在实现自己的超酷深度GAN模型之前,您必须了解一些非常重要的概念。如本 文所提的GAN模型新成员的引入:Wasserstein distance,boundary equilibrium 和 progressively growing GAN三个方面。

    2024年02月15日
    浏览(42)
  • 【计算机视觉】相机基本知识(还在更新)

    面阵相机则主要采用的 连续的、面状扫描光线 来实现产品的检测; 线阵相机即利用 单束扫描光 来进行物体扫描的工作的。 (1)面阵CCD工业相机: 优点 :应用面较广,如面积、形状、尺寸、位置,甚至温度等的测量。面阵CCD的优点是可以获取测量图像直观,二维图像信息

    2024年02月12日
    浏览(63)
  • 【计算机视觉|生成对抗】改进的生成对抗网络(GANs)训练技术

    本系列博文为深度学习/计算机视觉论文笔记,转载请注明出处 标题: Improved Techniques for Training GANs 链接:[1606.03498v1] Improved Techniques for Training GANs (arxiv.org) 本文介绍了一系列应用于生成对抗网络(GANs)框架的新的架构特性和训练过程。我们专注于GAN的两个应用领域:半监督

    2024年02月13日
    浏览(52)
  • 训练AI数据模型所需要的高性能计算机配置

      目录 配置一 配置二 配置三 云服务器和超级计算机        AI模型训练是一种机器学习的过程,通过训练深度学习模型来自动化处理数据和完成任务。AI训练可以帮助企业和研究人员开发出更加智能、高效的应用,从而提高生产力和创新能力。 以下是按训练性能从低到高

    2024年02月08日
    浏览(48)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包