大模型实战营Day4 XTuner 大模型单卡低成本微调实战 作业

这篇具有很好参考价值的文章主要介绍了大模型实战营Day4 XTuner 大模型单卡低成本微调实战 作业。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

按照文档操作:

大模型实战营Day4 XTuner 大模型单卡低成本微调实战 作业,深度学习,人工智能,AIGC,prompt单卡跑完训练:大模型实战营Day4 XTuner 大模型单卡低成本微调实战 作业,深度学习,人工智能,AIGC,prompt

按照要求更改微调的数据:

大模型实战营Day4 XTuner 大模型单卡低成本微调实战 作业,深度学习,人工智能,AIGC,prompt

完成微调数据的脚本生成:

大模型实战营Day4 XTuner 大模型单卡低成本微调实战 作业,深度学习,人工智能,AIGC,prompt

修改配置文件:大模型实战营Day4 XTuner 大模型单卡低成本微调实战 作业,深度学习,人工智能,AIGC,prompt

替换好文件后启动:大模型实战营Day4 XTuner 大模型单卡低成本微调实战 作业,深度学习,人工智能,AIGC,prompt

启动后终端如图:大模型实战营Day4 XTuner 大模型单卡低成本微调实战 作业,深度学习,人工智能,AIGC,prompt

用于微调的一些数据显示:

大模型实战营Day4 XTuner 大模型单卡低成本微调实战 作业,深度学习,人工智能,AIGC,prompt

训练时间,loss:

大模型实战营Day4 XTuner 大模型单卡低成本微调实战 作业,深度学习,人工智能,AIGC,prompt

可见模型是经过微调数据反复纠正,慢慢被引导向微调设计者所想的方向:

大模型实战营Day4 XTuner 大模型单卡低成本微调实战 作业,深度学习,人工智能,AIGC,prompt

3个epoch完:

大模型实战营Day4 XTuner 大模型单卡低成本微调实战 作业,深度学习,人工智能,AIGC,prompt

参数转换、合并:大模型实战营Day4 XTuner 大模型单卡低成本微调实战 作业,深度学习,人工智能,AIGC,prompt

大模型实战营Day4 XTuner 大模型单卡低成本微调实战 作业,深度学习,人工智能,AIGC,prompt更改路径为现存的参数:大模型实战营Day4 XTuner 大模型单卡低成本微调实战 作业,深度学习,人工智能,AIGC,prompt

用streamlit进行启动模型,开始对话:

大模型实战营Day4 XTuner 大模型单卡低成本微调实战 作业,深度学习,人工智能,AIGC,prompt大模型实战营Day4 XTuner 大模型单卡低成本微调实战 作业,深度学习,人工智能,AIGC,prompt

但是有错误 ,到DDL了。

大模型实战营Day4 XTuner 大模型单卡低成本微调实战 作业,深度学习,人工智能,AIGC,prompt

加载完镜像后再运行,其他能显示,图片却不能,心态小崩。

大模型实战营Day4 XTuner 大模型单卡低成本微调实战 作业,深度学习,人工智能,AIGC,prompt

模型已经微调完,图片总是有问题,如我的远程登录一般无二。文章来源地址https://www.toymoban.com/news/detail-807109.html

到了这里,关于大模型实战营Day4 XTuner 大模型单卡低成本微调实战 作业的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Pytorch-day09-模型微调-checkpoint

    torchvision微调 timm微调 半精度训练 起源: 1、随着深度学习的发展,模型的参数越来越大,许多开源模型都是在较大数据集上进行训练的,比如Imagenet-1k,Imagenet-11k等 2、如果数据集可能只有几千张,训练几千万参数的大模型,过拟合无法避免 3、如果我们想从零开始训练一个

    2024年02月11日
    浏览(36)
  • Django Web开发(day4)——数据模型使用与填充网站数据(对数据库的基本操作)

    本博客将会涉及:  Django 数据模型的使用 视频数据的导入 admin 后台的使用  1、Django 数据模型的使用  在上一篇中完成了网站的数据模型的创建,在数据模型创建之后, Django 会为我们的数据模型创建一套数据库抽象的 API 接口,以供我们进行检索数据、创建数据、更新和修

    2024年01月18日
    浏览(54)
  • 【LLM】Prompt tuning大模型微调实战

    prompt tuning可看做是prefix tuning的简化版本,在输入层加入prompt tokens,并不需要加入MLP进行调整来解决难训练的问题,作者实验表明随着预训练模型参数量的增加,prompt tuning效果逼近fine tuning效果 之前提到过可以借助 peft 库(Parameter-Efficient Fine-Tuning)进行微调,支持如下tuni

    2024年02月13日
    浏览(51)
  • 【LLM】金融大模型场景和大模型Lora微调实战

    金融行业需要垂直领域LLM,因为存在金融安全和数据大多数存储在本地,在风控、精度、实时性有要求 (1)500亿参数的BloombergGPT BloombergGPT金融大模型也是用transformer架构,用decoder路线, 构建目前规模最大的金融数据集FINPILE,对通用文本+金融知识的混合训练。 用了512块40

    2024年02月12日
    浏览(52)
  • GPT实战系列-如何用自己数据微调ChatGLM2模型训练

    广告文案生成模型 输入文字 :类型#裙 颜色#蓝色 风格#清新*图案#蝴蝶结 输出文案 :裙身处采用立体蝴蝶结装饰辅以蓝色条带点缀,令衣身造型饱满富有层次的同时为其注入一丝甜美气息。将女孩清新娇俏的一面衬托而出。 训练和测试数据组织: 数据可以从 下载链接,t

    2024年02月06日
    浏览(50)
  • Gemma谷歌(google)开源大模型微调实战(fintune gemma-2b/7b)

    Gemma-SFT(谷歌, Google), gemma-2b/gemma-7b微调(transformers)/LORA(peft)/推理 v1, 20240222, transformers==4.38.0时候, 微调只跑通了gemma-2b-it(因为只计算了output的loss, 且使用的是fp16), 同时该版本transformers实现有些问题, 比如说1.tokenizer要加bos, 2.RoPE计算精度问题(float32), 3.激活函数gelu_pytorch_tanh; v2,

    2024年04月11日
    浏览(52)
  • ChatGLM-6B模型微调实战(以 ADGEN (广告生成) 数据集为例,序列长度达 2048)

    kingglory/ChatGLM-6B 项目地址 1 介绍 对于 ChatGLM-6B 模型基于 P-Tuning v2 的微调。P-Tuning v2 将需要微调的参数量减少到原来的 0.1%,再通过模型量化、Gradient Checkpoint 等方法,差不多需要 7GB或则8GB 显存即可运行。 2 环境 2.1 python 环境 或者 2.2 下载代码 2.3 安装依赖 运行微调需要4.27

    2024年02月03日
    浏览(46)
  • 基于LLaMA Factory,单卡3小时训练专属大模型 Agent

    大家好,今天给大家带来一篇 Agent 微调实战文章 Agent (智能体)是当今 LLM(大模型)应用的热门话题 [1],通过任务分解(task planning)、工具调用(tool using)和多智能体协作(multi-agent cooperation)等途径,LLM Agent 有望突破传统语言模型能力界限,体现出更强的智能水平。

    2024年01月25日
    浏览(54)
  • 《实战AI模型》——赶上GPT3.5的大模型LLaMA 2可免费商用,内含中文模型推理和微调解决方案

    目录 准备环境及命令后参数导入: 导入模型: 准备LoRA: 导入datasets: 配置

    2024年02月16日
    浏览(64)
  • LLaMA-META发布单卡就能跑的大模型

    2023年2月25日,Meta使用2048张A100 GPU,花费21天训练的Transformer大模型LLaMA开源了。 1.4T tokenstakes approximately 21 days 以下是觉得论文中重要的一些要点 1)相对较小的模型也可以获得不错的性能 研究者发现在给定计算能力限制的情况下,最好的性能并不是来源于更大的模型,而是来

    2023年04月08日
    浏览(36)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包