一、简述
这里主要介绍了基于自定义动作识别数据集训练用于视频分类的 3D 卷积神经网络 (CNN) 。3D CNN 使用三维滤波器来执行卷积。内核能够在三个方向上滑动,而在 2D CNN 中它可以在二维上滑动。
这里的模型主要基于D. Tran 等人2017年的论文“动作识别的时空卷积研究”。
https://arxiv.org/abs/1711.11248v3https://arxiv.org/abs/1711.11248v3
1、模型结构
文章来源:https://www.toymoban.com/news/detail-817351.html
2、数据集
数据集使用的是别人贡献的开源数据集,感谢所有愿意开源的兄弟。文章来源地址https://www.toymoban.com/news/detail-817351.html
到了这里,关于机器学习笔记 - 基于自定义数据集 + 3D CNN进行视频分类的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!