玩LLM和StableDiffusion常说的LoRA到底是什么

这篇具有很好参考价值的文章主要介绍了玩LLM和StableDiffusion常说的LoRA到底是什么。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

论文地址:LoRA: Low-Rank Adaptation of Large Language Models

玩LLM和StableDiffusion常说的LoRA到底是什么

LoRA是一种用于adapters和大模型迁移的技术,全称为Low-Rank Adaptation of Large Language Models。它最初主要是用于大型语言模型(LLM)的跨领域与跨语言迁移。在微软的论文《LoRA: Low-Rank Adaptation of Large Language Models》提出了一种低秩adapters学习技术LoRA,实现大规模语言模型的跨领域与跨语言迁移。其主要内容如下:

1. 低秩分解:将adapters的参数表示为两个小矩阵U和V的乘积,而不是一个大参数矩阵。这可以显著降低计算复杂度,使adapters可以应用于大语言模型中。

玩LLM和StableDiffusion常说的LoRA到底是什么

2. 多粒度:提出在词、段落与任务三个粒度学习适配器参数,实现不同粒度的语言变化建模。

3. 异构框架:LoRA可以应用于BERT与GPT等不同结构的transformer模型,实现跨模型的adapters迁移。

4. 无监督学习:使用预测-聚合损失函数进行adapters参数学习,无需额外标注数据。这使得LoRA可以广泛应用于各种downstream任务。

5. 实验结果:在GLUE与XNLI数据集上验证了LoRA的有效性。使用LoRA的RoBERTa在所有任务上的平均精度达到80.5,超过RoBERTa-Large的78.9。LoRA还可以显著提高低资源语言AdaBERT的性能。

6. 案例研究:证明LoRA可以实现跨领域(文本分类到问答)和跨语言(英语到西班牙语)的迁移与扩展。并可实现词性别偏倚的有效消除。

LoRA不仅可以实现跨领域与跨语言的迁移,也可用于消除模型的社会偏倚与不公平性。这使得大语言模型可以更广泛服务于人类社会与多语言应用。LoRA是一项具有广泛影响的技术,它拓展了语言模型迁移与适配的范围与可能性,为其真正产业化运用奠定了重要基石。

LoRA的典型应用场景有:

1. 低资源语言处理:通过学习低秩adapters,可以将大规模语言模型迁移到低资源语言中,实现其扩展。

2. 跨领域迁移:可以学习领域适配的adapters,实现同一模型在不同应用领域的迁移,如文本分类、问答等。

3. 词性别偏倚消除:可以学习性别中性化的adapters,应用于已经预训练的语言模型中以消除性别偏倚。

4. 多语言机器翻译:可以学习语言适配的adapters,使单一语言模型可以支持多语言机器翻译任务。

5. 语言协同训练:通过分别学习单语言adapters与跨语言adapters,可以实现多语言模型的协同训练与融合。

LoRA技术最近被应用于Stable Diffusion模型中,以实现该模型在不同领域与任务中的迁移。这产生了以下主要影响:

1. 多模态语义表示。Stable Diffusion是一个多模态语言-图像模型,LoRA可以学习将其语言表征迁移到图像modal中,从而获得跨模态语义一致的表示。这可以增强模型的语义理解能力与生成效果。

2. 低资源语言扩展。Stable Diffusion仅支持高资源语言如英语,而LoRA可以学习语言适配器将其扩展到其他语言,如法语、西班牙语等。这使得低资源语言也可以受益于基于Diffusion的生成技术。

3. 样式与风格迁移。Learning adapters可以实现将Stable Diffusion模型从一个生成样式或风格迁移到其他样式与风格,如从写实主义迁移到立体主义等。这可以扩展模型的表达与创作范围。如下图的柱子哥就是通过LoRA画出来的,光靠StableDiffusion原始模型是很难画的这么生动的:

玩LLM和StableDiffusion常说的LoRA到底是什么

4. 领域适配。Stable Diffusion是一个通用的多模态模型,而通过LoRA可以学习特定领域的适配器,实现模型到特定领域如科技新闻、体育赛事的迁移,产生更加专业与准确的生成效果。

5. 私有数据集精调。用户可以使用自己的私有数据集学习专属的LoRA适配器,将Stable Diffusion模型迁移到用户专属的生成空间或风格中。这可以产生更加个性化的生成结果以满足用户需求。

LoRA技术的引入大大拓展了Stable Diffusion模型的应用范围与表达能力。它不仅可以使该模型具备多语言以及多模态的语义理解与生成能力,还可以实现领域专化与个性化的效果。这使得基于Diffusion的生成框架可以被真正落地到实际应用环境中,为用户提供个性化与定制化的生成体验。LoRA的使用使Stable Diffusion这个通用框架进一步迈向产业化和大众化。文章来源地址https://www.toymoban.com/news/detail-497114.html

到了这里,关于玩LLM和StableDiffusion常说的LoRA到底是什么的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【Java】深入了解双亲委派机制(常说的类加载机制)

    ava虚拟机(JVM)的类加载机制是Java应用中不可或缺的一部分。本文将详细介绍JVM的双亲委派机制,并阐述各关键点。 双亲委派机制(Parent-Delegate Model)是Java类加载器中采用的一种类加载策略。该机制的核心思想是:如果一个类加载器收到了类加载请求,默认先将该请求委托

    2024年02月04日
    浏览(36)
  • StableDiffusion 学习笔记 - 训练 LoRA

    最近一直在学习使用 Stable Diffusion,目前开始学习 LoRA 训练,试图使用 LoRA 微调预训练模型,实现脸型替换等常用功能 最开始我跑去了 LoRA 的官方仓库,虽然找到了 lora_pti 工具,但是没有理解数据集的准备方式,翻阅代码也没有理解到有用的信息 后面我找到了 SDWebUI 的 Ima

    2024年02月02日
    浏览(36)
  • StableDiffusion中LORA模型的使用

    目录 前言 一、LoRA是什么? 二、使用方法 1.存放LORA模型 2.使用LORA模型 3.查看结果 总结 (1)Sampler——采样方式,在Stable Diffusion WebUI中的Sampling method中进行选择 (2)Model——作者使用的大模型,在Stable Diffusion WebUI中的Stable Diffusion checkpoint中进行选择 (3)CFG scale——提示词

    2024年02月09日
    浏览(34)
  • AI绘画:StableDiffusion炼丹Lora攻略-实战萌宠图片生成

    近期在小红书发现了许多极其可爱、美观的萌宠图片,对这些美妙的图像深深着迷 于是想着看看利用AI绘画StableDiffusion以下简称(SD)做出来。 以下是详细实操的全过程,包括所有用的资料已经打包到网盘。 最后尝试的最终效果如下: 更多图片请查看网盘: 「萌宠图片及关

    2024年02月16日
    浏览(42)
  • LLM_StableDiffusion_studio发布

    从chatgpt发布到现在已经超过半年时间,AGI的势头越来越猛。大家都在做各种的尝试和组合,把chatgpt通用的强大的知识表达和理解能力尝试应用在自己的业务场景。前期也是出现非常多的业务应用,但是主要还是围绕chatgpt本身已经开放的能力:生成、续写、摘要、简单代码生

    2024年02月12日
    浏览(28)
  • 【AI绘画】Stablediffusion必不可少的使用方法之Lora(2)

    各位小伙伴们大家好,在上期我们讲过了Lora的原理和使用前景,那么这期主要要说的就是Lora应该如何使用! 前提是各位小伙伴们已经下载好了Lora,Lora文件需要放在Webui文件夹内的models中的Lora目录内。 Lora的使用方法有三个: (1)直接输入: 在提示词框内输入Lora:你下载的

    2024年01月17日
    浏览(46)
  • 【AI绘画】Stablediffusion必不可少的使用方法之Lora(1)

    首先大家要明白,Lora到底是什么? 在这里,我得先和大家聊聊小白刚开始使用AI绘图会遇到的问题,纵使前几期,我们已经讲解了如何安装Stablediffusion和它的使用方法,但是!很多小伙伴会不会依然觉得,如果我每次都要依靠大量的正反去塑造我的AI图,那么当

    2024年01月18日
    浏览(40)
  • AIGC:【LLM(一)】——LoRA微调加速技术

    Instruct微调和LoRA微调是两种不同的技术。 1.1 Instruct微调 Instruct微调是指在深度神经网络训练过程中调整模型参数的过程,以优化模型的性能。在微调过程中,使用一个预先训练好的模型作为基础模型,然后在新的数据集上对该模型进行微调。Instruct微调是一种通过更新预训练

    2024年02月05日
    浏览(63)
  • PEFT学习:使用LORA进行LLM微调

    由于LORA,AdaLORA都集成在PEFT上了,所以在使用的时候安装PEFT是必备项 方法一:PyPI To install 🤗 PEFT from PyPI: 方法二:Source New features that haven’t been released yet are added every day, which also means there may be some bugs. To try them out, install from the GitHub repository: If you’re working on contributing to th

    2024年02月10日
    浏览(49)
  • 电影《潜行》中说的蜜罐是什么(网络安全知识)

    近期刘德华、彭于晏主演的电影《潜行》在网上掀起了轩然大波,电影中有提到网络蜜罐,这引起了很多观众的疑问,蜜罐到底是什么? 从字面意思上来看,蜜罐就是为黑客设下的诱饵。这是一种具有牺牲性质的计算机系统,目的就是吸引网络攻击。进而企图获取攻击者的信

    2024年01月17日
    浏览(50)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包