视频理解学习笔记（二）：I3D and Kinetics Dataset-Toy模板网

这篇具有很好参考价值的文章主要介绍了视频理解学习笔记（二）：I3D and Kinetics Dataset。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

视频理解的三个流派（怎么处理时序）

其他：

Workshop: CVPR’17
论文标题：Quo Vadis, Action Recognition? A New Model and the Kinetics Dataset

论文地址：https://arxiv.org/abs/1705.07750

论文作者：

Joao Carreira from DeepMind
Andrew Zisserman from DeepMind and Department of Engineering Science, University of Oxford (他也是双流网络的二作)

主要贡献：

该数据集包括400个人类动作的类别，每个类别对应至少400的视频片段，且每个片段都来自不同的YouTube视频。每个视频片段（clip）都是10s。

Inflate：保持2D卷积网络框架，将2D的卷积核全部替换成3D的卷积核，将2D的pooling全部替换成3D的pooling。

bootstrap：引导
将2D图片重复n次获得一个n帧的boring video；将2D预训练好的模型的参数重复n次，并且rescale（即除以n，因为初始化要保证2D网络和3D网络面对同样的输入，可以得到同样的输出），赋给3D模型。

视频理解学习笔记（二）：I3D and Kinetics Dataset

视频理解学习笔记（二）：I3D and Kinetics Dataset

迁移学习实验效果：
视频理解学习笔记（二）：I3D and Kinetics Dataset
肯定了预训练和迁移学习。

和其他方法对比：
视频理解学习笔记（二）：I3D and Kinetics Dataset 文章来源地址https://www.toymoban.com/news/detail-459242.html

到了这里，关于视频理解学习笔记（二）：I3D and Kinetics Dataset的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！