Prompt Tuning 和instruct tuning-Toy模板网

这篇具有很好参考价值的文章主要介绍了Prompt Tuning 和instruct tuning。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

Prompt Tuning 是啥？

prompt的思想是，把下游任务的输入转化为预训练模型的原始任务。

以bert作为举例，假设任务是文本分类。“今天天气很好。”我们想判断一下这句话的情感是正面还是负面

fine-tune的方法是在bert之后接一个head，然后调整整个模型。

prompt 的方法是把下游任务转化为预训练任务，我们知道bert的预训练任务是MLM，于是把

“今天天气很好。”转化为“今天天气很好。我很[mask][mask]”，我们希望bert预测出"开心"两个字。然后对“开心”映射到正面情感。

prompt-tuning：我们知道prompt的方法是把下游任务转化为预训练任务，但是怎么转化效果会好呢。比如如下几种prompt：

1.“今天天气很好。我很[mask][mask]”

2.“今天天气很好。我非常[mask][mask]”

3.“今天天气很好。我的心情是[mask][mask]”

我们并不知道哪种prompt是最好的，于是我们希望模型可以自己去学习，于是就提出了prompt-tuning（提示微调），该方法会固定预训练模型的参数（与fine-tune不同之处），增加额外的参数来训练，常见的方法有prompt-tuning, prefix-tuning, p-tuning，与fine-tune不同，可训练参数一般都是加载embbeding层，而不是加在最后

提示学习Prompt Tuning：面向研究综述 - 知乎

huggingface上的一篇博文也解释的很清楚