实验心得,包括代码复现工作的体会

这篇具有很好参考价值的文章主要介绍了实验心得,包括代码复现工作的体会。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

实践是检验真理的唯一标准
resnet20,cifar100.
Direct training:
和原论文一样的参数
64.45
time step 1, Accuracy = 0.5918
time step 2, Accuracy = 0.6320
time step 4, Accuracy = 0.6446
time step 8, Accuracy = 0.6531
time step 16, Accuracy = 0.6608
time step 32, Accuracy = 0.6631
和原论文69.97相差比较大。

加了部分预处理,参数不变(这里参数改成和下面一样变说不定就可以):
64.69
time step 1, Accuracy = 0.5931
time step 2, Accuracy = 0.6319
time step 4, Accuracy = 0.6387
time step 8, Accuracy = 0.6483
time step 16, Accuracy = 0.6601
time step 32, Accuracy = 0.6645
实验证明:原论文在扯淡。鉴定完毕。

师哥full precision pretrain,然后做finetune

  • epoch = 200
    lr = 0.01
    wd = 1e-5
    128 sgd cosine

69.24 可以达到原论文的精度。
time step 1, Accuracy = 0.5398
time step 2, Accuracy = 0.6123
time step 4, Accuracy = 0.6373
time step 8, Accuracy = 0.6618
time step 16, Accuracy = 0.6954
time step 32, Accuracy = 0.7061

总结

  1. 对于cifar10来说,按照原论文直接训练量化网络的效果不错,这是因为cifar10是最简单的数据集;但是杜宇cifar100来说,如果去除了预训练的模型,效果就大打折扣-5%,因为训练难度升高了。
  2. 直接训练一个全精度的网络对于cifar100也要load一个pretrain的model,精度才能达到很高
  3. 一般量化过程是,先导入一个pretrain的model(这个model就是原始的vgg或者resnet里的model)这样可以直接load进来,然后再改模型,这样模型的参数并不是全部随机的,而是已经有部分是最优的。
    而一般导一个自己模型训练好的模型的顺序是先把模型改好再导入你用该模型训练好的pth文件,这样才能load进来,逻辑上有些不同,体现在导入这个过程是在更改模型前还是后。
  4. finetune的过程要把学习率和wd设置的小一点epoch也可以小一点,上面那个finetune的过程是 lr=0.01.wd=1e-5 (直接训练为0.02,wd=5e-4)

泽凯哥:
多卡训练注意调整:batch_size * 4, lr * 2(根号下)
torch.optim.lr_scheduler.ReduceLROnPlateau

理想状态下的收敛效果:
实验心得,包括代码复现工作的体会,python

pip intall fasteai
实验心得,包括代码复现工作的体会,python文章来源地址https://www.toymoban.com/news/detail-627422.html

到了这里,关于实验心得,包括代码复现工作的体会的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 小白系统地学习it技术--python的心得体会

    19年我研究生入学,当时定的方向是利用深度学习来进行故障诊断。当时第一次接触深度学习这个词,然后开始系统地学习相关知识。当时摆在我面前的有两款程序语言MATLAB与python。我知道对于我这种小白,想要学好需要有大量的视频学习资料,我看书学习效率低下,喜欢看

    2024年02月07日
    浏览(26)
  • 学习python过程中的心得体会和收获,也说一下好处坏处

    首先,Python是一种流行的编程语言,用于数据分析、机器学习、人工智能等领域。Python的语法简单易懂,易于学习和理解。这使得它成为许多初学者的首选编程语言。 对于初学者来说,建议从基础开始学习,例如语法、数据类型、控制流等。同时,也要多做一些练习和项目,

    2024年02月15日
    浏览(30)
  • 神经网络的心得体会,神经网络心得体会

    。 现在深度学习在机器学习领域是一个很热的概念,不过经过各种媒体的转载播报,这个概念也逐渐变得有些神话的感觉:例如,人们可能认为,深度学习是一种能够模拟出人脑的神经结构的机器学习方式,从而能够让计算机具有人一样的智慧;而这样一种技术在将来无疑是

    2024年02月05日
    浏览(24)
  • Spark心得体会

            学习了spark之后我才知道Hadoop和spark还有着这种缘分:Hadoop 是由Java语言编写的,部署在分布式服务器集群上,用于存储海量数据并运行分布式分析应用的开源框架;其重要组件有,HDFS 分布式文件系统、MapReduce 编程模型、Hbase 基于HDFS的分布式数据库:擅长实时随

    2024年02月11日
    浏览(24)
  • Unity心得体会

    在当今这个高度信息化的时代,计算机技术已经成为了我们生活中不可或缺的一部分。而在计算机技术中,游戏开发无疑是一个非常重要的领域。作为一名热爱游戏的玩家,我一直对游戏开发抱有浓厚的兴趣。在大学期间,我有幸接触到了Unity这款强大的游戏引擎,并开始了

    2024年02月03日
    浏览(27)
  • 近期参与开源的心得体会

    最近随着Kepler项目加入CNCF sandbox,写一篇blog来记录下参与这个项目半年的发展的心得体会。 项目的运营最好还是专注于项目自身的发展,围绕项目的特点,创新点入手,为大家提供价值,从而自然而然的扩大自身影响力。 我们的文档写的,并不好。这是Thoughtworks技术雷达对

    2024年02月11日
    浏览(77)
  • STM32-个人心得体会

    目录 什么是STM32? 该怎么学STM32? 个人实践案例 总结         1.概述         在准备学习STM32之前,得知道什么是STM32,大家翻阅资料都知道STM32是意法半导体(STMicroelectronics)公司推出的一系列32位基于ARM Cortex-M内核的微控制器。它具有低功耗、高性能和丰富的外设资源

    2024年02月04日
    浏览(30)
  • JAVA 实训报告心得体会

    一开始想做计算器那个课题,原因很简单,就是因为我感觉那个课题很简 单,在百度里一搜就搜到了一模一样的源程序。只是感觉没什么意思,那个界面也 不是很好看,又不好玩。所以就做了现在这个猜数游戏。一直想编个游戏程序,于 是就到网上去搜代码,一下子就搜到

    2024年02月13日
    浏览(28)
  • 关于参加大学生挑战杯赛的心得体会

    CSDN话题挑战赛第1期 活动详情地址:https://marketing.csdn.net/p/bb5081d88a77db8d6ef45bb7b6ef3d7f 参赛话题:大学生竞赛指南 话题描述:本话题聚焦于大学生竞赛心得体会分享,对于计算机众多领域每年都有很多都会举办科技竞赛,很多学生也都会踊跃参与,每到竞赛结束,学生们都会收

    2024年02月06日
    浏览(28)
  • Labview实现程序控制(有一篇心得体会)

    这次博客,我将刚刚所学的知识进行总结。如有不足,欢迎交流。 使用移位寄存器或反馈节点计算0+5+10+…+50的值 用顺序结构实现两数相加,同时实现两数相加后再乘以2。 使用条件结构实现5个LED轮流亮灭。 设计一个VI程序,前面板如下。单击确定,计数加1;单击停止,程序

    2024年02月09日
    浏览(25)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包