Xtuner大模型微调

这篇具有很好参考价值的文章主要介绍了Xtuner大模型微调。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

Xtuner大模型微调

一、课程笔记

文档链接:https://github.com/InternLM/tutorial/blob/main/xtuner/README.md
视频链接: https://www.bilibili.com/video/BV1yK4y1B75J/

大模型微调

大模型的训练利用了各类数据,可以说是一个通才,但是在某个专业领域是很缺乏知识储备的,除了用RAG算法给LLM增加知识外挂,还可以用微调(fine tuning)的方式把专业知识教给LLM。如果说RAG是一边答题一边查书的开卷考试,微调就是送这个啥知识都知道一些的通才去学一个专业,专业领域内的成为专才。

XTuner微调工具

微调大模型需要相关的软件工具,用来导入各种数据集,训练各类大模型,XTuner就是这样的工具。XTuner包含了主流开源大模型(baichuan、chatglm、internlm、llama、qwen)的微调配置文件,开箱即用,一行命令就可以启动微调。

二、作业实践

基础作业:

构建数据集,使用 XTuner 微调 InternLM-Chat-7B 模型, 让模型学习到它是你的智能小助手,效果如下图所示,本作业训练出来的模型的输出需要将不要葱姜蒜大佬替换成自己名字或昵称!

作业参考答案:https://github.com/InternLM/tutorial/blob/main/xtuner/self.md

微调前:
Xtuner大模型微调,人工智能

微调的epoch设置为1,打印日志显示,微调没有起作用:
Xtuner大模型微调,人工智能

把epoch设置为3,到了epoch1的后半期,微调起了作用:

Xtuner大模型微调,人工智能

跑完epoch1后,中断微调训练,直接导出epoch跑出的模型文件,启动web界面运行:
Xtuner大模型微调,人工智能文章来源地址https://www.toymoban.com/news/detail-809905.html

到了这里,关于Xtuner大模型微调的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 人工智能_CPU安装运行ChatGLM大模型_安装清华开源人工智能AI大模型ChatGlm-6B_004---人工智能工作笔记0099

    上一节003节我们安装到最后,本来大模型都可以回答问题了,结果, 5分钟后给出提示,需要GPU,我去..继续看官网,如何配置CPU运行  没办法继续看: 这里是官网可以看到  需要gcc的版本是11.3.0,这里我们先没有去安装,直接试试再说 yum install epel-release yum install gcc-11.3.0 安装的话执行这

    2024年02月21日
    浏览(66)
  • 从AI人工智能LLM大型语言模型到通用人工智能AGI “世界模型”的演进路径

    近年来,人工智能技术取得了飞速的发展,各种领域都出现了涉及人工智能的应用。大型语言模型(Large Language Model, LLM)作为其中一种重要的技术手段,已成为当前自然

    2024年02月08日
    浏览(92)
  • 【人工智能】MAAS 模型即服务:概念、应用场景、优势、挑战等 —— 我们人类已经进入人工智能大模型时代

    目录 导言 一、MAAS概述 二、MAAS的应用场景 1. 自然语言处理(NLP)

    2024年02月06日
    浏览(65)
  • 常见的人工智能模型

    人工智能模型有很多,其中一些比较常见的包括: 一、逻辑回归(Logistic Regression):是一种用于解决二分类问题的线性模型,可用于预测结果为0或1的概率。 逻辑回归是一种二分类的机器学习算法,适用于预测一个事件发生的概率。逻辑回归模型通常基于已知数据集进行训

    2024年02月06日
    浏览(117)
  • 【人工智能】大模型技术生态

    随着人工智能技术的快速发展,大模型技术作为人工智能领域的重要组成部分,正逐渐成为推动人工智能技术发展的核心力量之一。大模型技术以其在自然语言处理、图像识别、音频处理等多个领域中的卓越表现,受到了广泛的关注和应用。本文将围绕大模型技术生态展开探

    2024年02月07日
    浏览(61)
  • 什么是人工智能大模型?

    人工智能大模型是指具有巨大参数量和复杂结构的人工智能模型。它们通过深度学习和神经网络技术,能够处理大规模的数据集和复杂的任务。这些大模型在自然语言处理、计算机视觉、语音识别等领域展现了强大的性能和能力。 以下是对人工智能大模型的详细介绍: 人工

    2024年02月12日
    浏览(40)
  • 【AI人工智能大模型】如何基于大模型打造企业的智能底座?

    目录 如何基于大模型打造企业的智能底座? 1. 引言

    2024年02月08日
    浏览(83)
  • 人工智能_普通服务器CPU_安装清华开源人工智能AI大模型ChatGlm-6B_001---人工智能工作笔记0096

    使用centos安装,注意安装之前,保证系统可以联网,然后执行yum update 先去更新一下系统,可以省掉很多麻烦 20240219_150031 这里我们使用centos系统吧,使用习惯了. ChatGlm首先需要一台个人计算机,或者服务器, 要的算力,训练最多,微调次之,推理需要算力最少 其实很多都支持CPU,但为什么

    2024年02月20日
    浏览(63)
  • 利用人工智能模型学习Python爬虫

    爬虫是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。 网络爬虫(又称为网页蜘蛛,网络机器人)是其中一种类型。 爬虫可以自动化浏览网络中的信息,当然浏览信息的时候需要按照我们制定的规则进行,这些规则我们称之为网络爬虫算法。 ——使用讯飞星火

    2024年02月09日
    浏览(48)
  • 人工智能学习笔记六——CBOW模型

    连续词袋模型(CBOW)模型是word2vec下的一个模型,是一群用来产生词向量的相关模型。这些模型为浅而双层的神经网络,用来训练以重新建构语言学之词文本。 网络 以词表现,并且需猜测相邻位置的输入词,在word2vec中词袋模型假设下,词的顺序是不重要的。训练完成之后,

    2024年02月14日
    浏览(42)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包