快速训练自己的大语言模型：基于LLAMA-7B的lora指令微调

9月前作者：lokvke 分类：Toy博客阅读(56) 违法举报

这篇具有很好参考价值的文章主要介绍了快速训练自己的大语言模型：基于LLAMA-7B的lora指令微调。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

前言：

系统：ubuntu 18.04
显卡：A100-80G（蹭的，嘿嘿~）
（本次主要记录如何快速进行大模型的指令微调）

1. 选用工程：lit-llama

地址：https://github.com/Lightning-AI/lit-llama

2. 下载工程

git clone https://github.com/Lightning-AI/lit-llama.git

3. 安装环境

切换到工程目录

cd ./lit-llama

使用pip安装依赖库

pip install -r requirements.txt

（当然，这里可能会遇到网络问题，安装不了lightning）
可使用以下方式安装：

下载lightning工程
解压进入工程目录，使用以下命令安装
```
python setup.py install
```
查看lightning是否安装成功：
```
pip list|grep lightning
```
（这里注意lightning的版本是2.1.0）

4. 下载LLAMA-7B模型

这里我们要基于LLAMA-7B做指令微调，所以要先下载模型权重，并作一系列转换。

切换到 lit-llama 所在位置，使用以下命令下载权重：

python scripts/download.py --repo_id openlm-research/open_llama_7b --local_dir checkpoints/open-llama/7B

（文件有点大，需要等待一些时间）

下载完毕之后，会得到如下的文件：

5. 做模型转换

还是切换到 lit-llama 所在位置，使用以下指令进行转换

python scripts/convert_hf_checkpoint.py --checkpoint_dir checkpoints/open-llama/7B --model_size 7B

转换完毕之后，在 lit-llama/checkpoints/lit-llama/7B 位置，会得到大小为26G左右的 lit-llama.pth 文件，在上一级目录（lit-llama/checkpoints/lit-llama）还有一个tokenizer.model文件

6. 初步测试

在命令行，使用如下命令运行：

 python generate.py --prompt "Today is a"

快速训练自己的大语言模型：基于LLAMA-7B的lora指令微调

使用中文测试，发现效果不好（开始胡说八道了~）

7. 为什么要进行指令微调？

因为原始的预训练LLAMA模型是一个大语言模型（废话~），会根据前面的单词预测下一个词语，如果你问它问题，它不会正确回答你，你问它一个问题，它可能会续写一些跟你一样的句子，例如，
Prompt为 “What is the capital of China?”，它的回复如下所示：

8. 开始进行指令微调

8.1. 数据准备

这里使用alpaca的52k指令数据进行微调，使用如下指令：
```
python scripts/prepare_alpaca.py
```
如果下载不下来的话，我们直接打开scripts/prepare_alpaca.py文件，如下所示：
直接打开链接 https://raw.githubusercontent.com/tloen/alpaca-lora/main/alpaca_data_cleaned_archive.json，然后全选页面复制，再保存到新建的文件里。
得到alpaca_data_cleaned_archive.json（看名字的clean应该是清洗过的），每条指令包含"instruction"、“input”、"output"三个关键字，本次先不具体展开讲解，如下所示：
运行指令后，还会作数据划分，train-49759, val-2000如下所示：
最后，会在lit-llama/data/alpaca路径下得到以下文件：

8.2 开始模型训练

使用以下指令：
```
python finetune/lora.py
```
训练过程如下所示:
整个训练过程大约要1.5个小时（16:51 ~ 18:22）
训练完毕之后，会在out/lora/alpaca得到一系列lora的权重文件，如下图所示：

8.3 模型测试

使用如下指令进行提问，其中prompt为"what is the capital of China?"，
```
python generate/lora.py --prompt "what is the capital of China?"
```
得到的结果如下所示
可以看到，经过指令微调之后，模型已经可以正常回答我们的问题了。

（ps：其他细节可以参考工程的README，写的很清楚~）

结束。文章来源地址https://www.toymoban.com/news/detail-505054.html

到了这里，关于快速训练自己的大语言模型：基于LLAMA-7B的lora指令微调的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

LLMs之llama_7b_qlora：源代码解读inference_qlora.py(模型推理)使用LORA权重来初始化预训练的LLAMA模型来进行文本生成(基于用户交互输入的上下文生成新文本)

LLMs之llama_7b_qlora：源码解读inference_qlora.py(模型推理)使用LORA权重来初始化预训练的LLAMA模型来进行文本生成(基于用户交互输入的上下文生成新文本) 目录

2024年02月15日
浏览(73)
搭建部署属于自己的基于gpt3.5的大语言模型（基于flask+html+css+js+mysql实现）

本项目是一个基于GPT-3.5模型的聊天机器人网站，旨在为用户提供一个简便、直接的方式来体验和利用GPT-3.5模型的强大功能。项目以Flask为基础，构建了一个完整的Web应用程序，其中包含了多个前端页面和后端API接口，能够处理用户输入并与GPT-3.5模型进行交互来生成响应。一

2024年02月07日
浏览(65)
Peft库使用技巧（一）：合并基座模型与Lora模型【使用Peft库微调基座模型（比如LLaMA-7B）后会得到Lora参数模块，将基座模型与Lora参数合并后才能得到完整的微调后的大模型】

使用Peft库微调基座模型（比如LLaMA-7B）后会得到Lora参数模块，将基座模型与Lora参数合并后才能得到完整的微调后的大模型

2024年02月15日
浏览(51)
训练自己的Llama 2！大模型微调技术介绍

趋动云趋动云是面向 AI 算法工程师的开发平台，为工程师提供模型开发、模型训练、数据和代码管理等功能。近期有不少粉丝问算力君，趋动云是否支持大模型的训练？当然支持！最近大火的Llama 2一出来，算力君身边的小伙伴就已经跑过了，本文将介绍Llama 2和相关的大模

2024年02月12日
浏览(40)
LLMs之llama_7b_qlora：源代码解读inference.py(基于合并后的权重文件进行模型推理)将基于之前合并Lora模型权重后的hl_llama_7b模型进行文本生成(基于用户交互输入

LLMs之llama_7b_qlora：源码解读inference.py(基于合并后的权重文件进行模型推理)将基于之前合并Lora模型权重后的hl_llama_7b模型进行文本生成(基于用户交互输入的上下文生成新文本) 目录

2024年02月16日
浏览(47)
大语言模型(LLM)综述(四)：如何适应预训练后的大语言模型

随着人工智能和机器学习领域的迅速发展，语言模型已经从简单的词袋模型（Bag-of-Words）和N-gram模型演变为更为复杂和强大的神经网络模型。在这一进程中，大型语言模型（LLM）尤为引人注目，它们不仅在自然语言处理（NLP）任务中表现出色，而且在各种跨领域应用中也展示

2024年02月08日
浏览(51)
大模型入局传统算法，LLMZip基于LLaMA-7B实现1MB文本压缩率90%！

论文链接： https://arxiv.org/abs/2306.04050 随着以 ChatGPT、GPT-4为代表的AI大模型逐渐爆火进入公众视野，各行各业都开始思考如何更好的使用和发展自己的大模型，有一些评论甚至认为大模型是以人工智能为标志的第四次产业革命的核心竞争产品。例如在5月26日的北京中关村202

2024年02月11日
浏览(43)
省显存（内存？）的大语言模型（LLMs）训练/微调/推理方法

即使 RTX 3090 有着 24GB 的 RAM，使用一块 RTX 3090 依然无法 fp32 精度训练最小号的 LLaMA-6B。估算模型所需的RAM 首先，需要了解如何根据参数量估计模型大致所需的 RAM，这在实践中有很重要的参考意义。需要通过估算设置 batch_size，设置模型精度，选择微调方法和参数分布方法等

2024年02月09日
浏览(46)
图技术在 LLM 下的应用：知识图谱驱动的大语言模型 Llama Index

LLM 如火如荼地发展了大半年，各类大模型和相关框架也逐步成型，可被大家应用到业务实际中。在这个过程中，我们可能会遇到一类问题是：现有的哪些数据，如何更好地与 LLM 对接上。像是大家都在用的知识图谱，现在的图谱该如何借助大模型，发挥更大的价值呢？在本文

2024年02月15日
浏览(51)
LLMs之Vicuna：在Linux服务器系统上实Vicuna-7B本地化部署(基于facebookresearch的GitHub)进行模型权重合并(llama-7b模型与delta模型权重)、模型部

LLMs之Vicuna：在Linux服务器系统上实Vicuna-7B本地化部署(基于facebookresearch的GitHub)进行模型权重合并(llama-7b模型与delta模型权重)、模型部署且实现模型推理全流程步骤的图文教程(非常详细) 导读：因为Vicuna的训练成本很低，据说只需要$300左右，所以，还是有必要尝试本地化部署

2024年02月06日
浏览(74)