Q:如何简单的构建一个batch?
有一些代码喜欢把数据的预处理放在 data_collator 函数内,有时候我们希望自己构建一个batch简单的测试一下。
如果是普通的数据集可以使用:data_collator(eval_dataset[:3])
文章来源:https://www.toymoban.com/news/detail-589227.html
但如果是 transformer encode的数据集,使用切片会失效,可以使用列表推导式文章来源地址https://www.toymoban.com/news/detail-589227.html
batch = [eval_dataset[i] for i in range(3)]
data = data_collator(batch)
print(data)
到了这里,关于dataset 如何自己构建一个batch供DataCollator测试的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!