LLM微调 | Prefix-Tuning, Prompt-Tuning, P-tuning, P-tuning-v2

9月前作者：#苦行僧分类：Toy博客阅读(45) 违法举报

这篇具有很好参考价值的文章主要介绍了LLM微调 | Prefix-Tuning, Prompt-Tuning, P-tuning, P-tuning-v2。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

🔥 下面我只是分析讲解下这些方法的原理以及具体代码是怎么实现的，不对效果进行评价，毕竟不同任务不同数据集效果差别还是挺大的。文章来源地址https://www.toymoban.com/news/detail-622306.html

0、hard prompt & soft prompt区别

hard prompt (离散)：即人类写的自然语言式的prompt。
soft prompt (连续)：可训练的权重，可以理解为伪prompt。【毕竟nn是连续的模型，在连续空间中优化离散的prompt，难以优化到最佳效果。额也就是说所谓的hard prompt对于人类来说好理解，但模型不一定好理解，

到了这里，关于LLM微调 | Prefix-Tuning, Prompt-Tuning, P-tuning, P-tuning-v2的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

【LLM】Prompt tuning大模型微调实战

prompt tuning可看做是prefix tuning的简化版本，在输入层加入prompt tokens，并不需要加入MLP进行调整来解决难训练的问题，作者实验表明随着预训练模型参数量的增加，prompt tuning效果逼近fine tuning效果之前提到过可以借助 peft 库（Parameter-Efficient Fine-Tuning）进行微调，支持如下tuni

2024年02月13日
浏览(51)
大语言模型LLM微调技术：Prompt Tuning

截止23年3月底，语言模型发展走过了三个阶段：第一阶段：设计一系列的自监督训练目标（MLM、NSP等），设计新颖的模型架构（Transformer），遵循Pre-training和Fine-tuning范式。典型代表是BERT、GPT、XLNet等；第二阶段：逐步扩大模型参数和训练语料规模，探索不同类型的架构。

2024年02月03日
浏览(42)
[算法前沿]--008- AIGC和LLM下的Prompt Tuning微调范式

2023年07月04日
浏览(47)
【论文解读】Prefix-Tuning: Optimizing Continuous Prompts for Generation

一.介绍 1.1 前置知识 1.1.1 in-context learning At the limit, GPT-3 (Brown et al, 2020) can be deployed using in-context learning, which is a form of prompting, without modifying any LM parameters. \\\"部署\\\" 指的是将 GPT-3 模型用于实际应用或特定任务的过程。 \\\"In-context learning\\\" 是一种通过提供上下文或附加信息来指导

2024年02月07日
浏览(45)
Prompt-Tuning（一)

一、预训练语言模型的发展过程第一阶段的模型主要是基于自监督学习的训练目标，其中常见的目标包括掩码语言模型（MLM）和下一句预测（NSP）。这些模型采用了Transformer架构，并遵循了Pre-training和Fine-tuning的训练范式。通过预训练模型在大规模无标签数据上进行学习，可

2024年02月07日
浏览(43)
Prefix-tuning、Adapter、LLaMA-Adapter的流程图与伪代码实现

流程图：代码：流程图：代码：流程图：代码：

2024年02月11日
浏览(39)
ChatGLM-6B的P-Tuning微调详细步骤及结果验证

ChatGLM-6B 仓库地址：https://github.com/THUDM/ChatGLM-6B ChatGLM-6B/P-Tuning 仓库地址：https://github.com/THUDM/ChatGLM-6B/tree/main/ptuning 1.1 P-Tuning v2简介 P-Tuning 是一种较新的模型微调方法，它采用了参数剪枝的技术，可以将微调的参数量减少到原来的0.1%。具体来说， P-Tuning v2 是基于 P-Tuning v1 的

2024年02月06日
浏览(47)
基于 P-Tuning v2 进行 ChatGLM2-6B 微调实践

1. SFT监督微调：适用于在源任务中具有较高性能的模型进行微调，学习率较小。常见任务包括中文实体识别、语言模型训练、UIE模型微调。优点是可以快速适应目标任务，但缺点是可能需要较长的训练时间和大量数据。 2. LoRA微调：通过高阶矩阵秩的分解减少微调参数量，不

2024年02月08日
浏览(60)
ChatGLM-6B 部署与 P-Tuning 微调实战-使用Pycharm实战

ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型，基于 General Language Model (GLM) 架构，具有 62 亿参数。结合模型量化技术，用户可以在消费级的显卡上进行本地部署（INT4 量化级别下最低只需 6GB 显存）。 ChatGLM-6B 使用了和 ChatGPT 相似的技术，针对中文问答和对话进行了优

2024年02月15日
浏览(45)
大模型PEFT技术原理（一）：BitFit、Prefix Tuning、Prompt Tuning

随着预训练模型的参数越来越大，尤其是175B参数大小的GPT3发布以来，让很多中小公司和个人研究员对于大模型的全量微调望而却步，近年来研究者们提出了各种各样的参数高效迁移学习方法（Parameter-efficient Transfer Learning），即固定住Pretrain Language model（PLM）的大部

2024年01月25日
浏览(65)