Teacher forcing 是一种序列任务中的技术。它最初提出的动机是使得RNN的训练得以并行,加快模型训练。
简单来说Teacher forcing就是将数据集中的标签作为模型输入。
首先,以RNN为例,介绍Teacher forcing的技术细节。下图为RNN展开的计算图。
如图所示,Teacher forcing在训练时和测试时使用不同的输入。
训练时,使用数据标签作为输入;测试时使用模型的输出作为输入。
但是,在open-loop 模式下,模型在训练时和测试的输入会有较大差异。缓解该问题有如下方法:
(1) 在训练时同时输入真实的数据值(teacher forcing inputs) 和 模型生成的值。
(2) 在训练师随机选择真实的数据值和模型生成的值。文章来源:https://www.toymoban.com/news/detail-711862.html
参考: Deep learning文章来源地址https://www.toymoban.com/news/detail-711862.html
到了这里,关于Teacher Forcing的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!