Stable Diffusion11

这篇具有很好参考价值的文章主要介绍了Stable Diffusion11。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

也出到了11

Stable Diffusion 学会了「偷天换日」的本领。 学会在绘画中直接「擦除」侵权概念

任何一个创作过程,都是始于「模仿」、终于「创造」。对于 AI 来说,这一学习过程也是相同的。

近期,开源版本的 Stable Diffusion 文本到图像的扩散模型,使图像生成技术得到极为广泛的应用,但是如何规避色情或风格侵权是需要解决的问题,作者提出 Erased Stable Diffusion(ESD)方法,有效的解决了前面的问题。

文本到图像生成模型备受关注,其具备优秀的图像生成质量和看似无限的生成潜力。诸如此类的生成模型都是基于大规模的互联网数据集进行训练的,这使它们能够学习很广泛的概念。然而,模型生成的一些概念是不受欢迎的,比如受版权保护的内容和色情内容。

如何尽量避免模型输出这些内容呢?在最近的一篇论文中,来自美国东北大学、麻省理工学院的作者提出了一种在预训练之后有选择地从文本条件模型的权重中删除单个概念的方法。

论文链接:https://arxiv.org/pdf/2303.07345v1.pdf

此前的方法侧重于数据集过滤、post-generation 过滤或推理指导,而本文提出的方法不需要重新训练,这对于大型模型来说是不可思议的。基于推理的方法可以审查或有效引导模型输出的方式以避免生成不需要的概念。相比之下,本文的方法直接从模型的参数中将概念移除,从而可以安全地分配其权重。

图像生成中的安全问题

Stable Diffusion 文本到图像扩散模型的开源,让图像生成技术得到了极为广泛的应用,但也带来了一些问题。

为了限制不安全图像的生成,第一个 Stable Diffusion 版本绑定了 NSFW 滤波器,以便在滤波器被触发时审查图像,但由于代码和模型权重都是公开可用的,因此滤波器很容易被禁用。

为了防止敏感内容的生成,随后的 Stable Diffusion 2.0 模型对过滤的数据进行训练,以删除明显有问题的图像,实验是在 50 亿张图像的 LAION 数据集上进行的,消耗了 15 万个 GPU 时。

如此一来,整个过程的成本之高,使得在数据发生变化与涌现能力之间建立因果关系这件事极具挑战性。有些研究人员反映,从训练数据中删除明显问题图像和其他主题可能会对输出质量产生负面影响。 

尽管作者们付出了一系列努力,涉及色情的内容在模型的输出中仍然很普遍:当作者使用 Inappropriate Image Prompts (I2P) 基准测试的 4703 个 prompt 来评估图像的生成结果时,他们发现当前流行的 SD1.4 模型生成了 796 张暴露的身体部位的图片,而新的受训练集限制的 SD2.0 模型产生 417 张类似图片。

另一个问题是,文本到图像模型所模仿的作品可能是受版权保护的。AI 生成的艺术作品不仅在质量上与人类生成的艺术相媲美,而且还可以忠实地复制真实艺术家的艺术风格。Stable Diffusion 和其他大型文本到图像合成系统的用户发现,诸如「art in the style of [artist]」之类的 prompt 可以模仿特定艺术家的风格,从而有可能产生侵权的作品。此前,也正是因为多位艺术家的担忧,导致了一场针对 Stable Diffusion 制作主体的法律诉讼 —— 艺术家指控 Stable Diffusion 侵犯了他们的作品。为了保护艺术家,最近的一些工作尝试于在线发布艺术作品之前对艺术作品应用对抗干扰,以防止模型模仿它。然而,这种方法并不能从预训练模型中删除模型本已学习到的艺术风格。

因此,为了解决安全和版权侵犯的问题,本文的作者们提出了一种从文本到图像模型中「擦除概念」的方法,即 Erased Stable Diffusion(ESD),可以通过微调模型参数来实现擦除,而不需要额外的训练数据。

相比于训练集审查方法,本文提出的方法速度更快,并且不需要从头开始训练整个系统。此外,ESD 可用于目前已有的模型,无需修改输入图像。相比于 post-generation 过滤或简单的黑名单方法,「擦除」是不容易被绕过的,即使用户可以访问参数。

方法

ESD 方法的目标是使用自身的知识从文本到图像扩散模型中擦除概念,而不需要额外的数据。因此,ESD 选择微调预训练模型而不是从头开始训练模型。本文方法专注于 Stable Diffusion(SD),一个由三个子网络组成的 LDM,包括一个文本编码器 T、一个扩散模型 (U-Net)θ 和一个解码器模型 D。

ESD 通过编辑预训练的扩散 U-Net 模型的权重 θ 去除特定的风格或概念。ESD 是受到了无分类器指导方法和基于分数的合成等工作的启发。具体来说,使用无分类器指导的原则来训练扩散模型,将模型的分数从想要消除的特定概念 c 中擦除,例如「Van Gogh」这种词语。利用预训练模型对概念的认知,同时让其学习将微调输出的分布的质量从该概念中移除。

Stable Diffusion11

Stable Diffusion11

实验

艺术风格去除

为了分析对当代实践艺术家中的艺术模仿情况,作者选取了 5 位现代艺术家和艺术作品进行考察,分别是:Kelly McKernan、Thomas Kinkade、Tyler Edlin、Kilian Eng 以及「Ajin:Demi-Human」系列作品。据报道,这些作者或作品都曾被 Stable Diffusion 模型模仿。虽然作者没有观察到该模型直接复制某些特定的原创艺术作品,但不可否认的是,该模型必然捕捉到了这些艺术风格。

图 5 展示了相关定性结果,作者还进行了用户研究(图 6)以衡量人类对艺术风格去除效果的感知。最终的实验结果验证了该观察结果,即模型已经去除了特定艺术家的风格,同时保留了 prompt 内容和结构(图 5),并且对其它艺术风格的干扰最小。

Stable Diffusion11Stable Diffusion11显式内容删除

在图 7 中,与 Stable Diffusion v1.4 相比,裸体分类样本的百分比变化。作者通过使用推理方法(SLD)和过滤再训练方法(SD V2.0)研究了 ESD 的有效性。对于所有模型,使用的都是由 I2P prompt 生成 4703 张图像。他们使用 Nudenet 检测器将图像分类为各种裸体类别。结论是,在弱擦除比例 η=1 时,在所有类别中,ESD 方法在擦除裸体方面效果更显著。

Stable Diffusion11物体去除

表 2 中展示了原始 Stable Diffusion 模型和 ESD-u 模型在训练过程中擦除目标类时分类准确性的对比结果,同时展示了在生成剩余的九个类时的分类准确性。结果表明,ESD 能够在大多数情况下有效地去除目标类,尽管有一些类别(比如教堂)比较难去除。但未被去除的类别的分类准确性仍然很高,即使某些情况下会有一些干扰,例如,去除「法国圆号」会对其他类别造成明显的失真。作者在补充材料中提供了物体去除后的视觉效果图像。

Stable Diffusion11

whaosoft aiot http://143ai.com 文章来源地址https://www.toymoban.com/news/detail-503210.html

到了这里,关于Stable Diffusion11的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【Stable Diffusion安装】支持python3.11 window版

    主要的安装步骤是参考B站播放量第一的视频,但是那位阿婆主应该是没有编程经验,只强调使用 3.10 ,而python最新版本是 3.11 。 理论上来说,只是一个小版本的不同,应该是可以安装成功了。自己摸索了下,挺费劲了,故记录下,支持最新版 python3.11 的安装经验。 这里建议

    2024年02月09日
    浏览(29)
  • win11下部署stable diffusion docker版遇到的问题和解决方案

    为了在本地愉快流畅地体验stable diffsion,且不希望直接在windows中安装过多复杂的环境,顺便体验容器的部署和发布的便利,决定选择stable diffusion的docker版(AbdBarho版)。 网上已经有很多stable diffusion的部署文章,有很多甚至是零基础或者一键安装的,但自己尝试之后才发现还

    2024年02月07日
    浏览(41)
  • 【Kaggle】Stable Diffusion 竞赛(2023 年 5 月 11 日版本,准确率 0.59 + )

    第一行代码使用了 Linux 中的 mkdir 命令,其中选项 -p 表示如果要创建的目录已经存在则不会报错。 第二行代码导入了 Python 中的 PIL 库中的 Image 模块,该模块用于图像的读取、处理和保存。 第三行代码导入了 Python 中的 pathlib 库中的 Path 模块,该模块用于处理文件路径。 第四

    2024年02月09日
    浏览(36)
  • 记录Stable-Diffusion-Webui 在Windows11的Anaconda环境下的避坑安装

    #记录工作,工作复盘 仅作记录,未尽之处请补充,谢谢! 电脑配置情况大致记录如下,请参考: MSI移动工作站,64G内存,4GB显存 阅读文档,明确软件依赖和安装要求: 在用Anaconda环境下安装stable-diffusion-webui之前,电脑上先要安装有以下软件: 1、Anaconda 首先安装 Anaconda,

    2024年02月01日
    浏览(46)
  • win11从Github上源码安装AUTOMATIC1111/stable-diffusion-webui(使用anaconda+外接固态硬盘的解决方案)

    主要参考文章: 从零开始,手把手教你本地部署Stable Diffusion Webui AI绘画(Win系最新版) - 知乎 (zhihu.com) (其实在安装过程中因为遇到很多坑,已经看了非常多的安装教程,但写这篇备忘的时候已经都找不到了。感谢这些作者无私分享,很遗憾这里只能上这个最后一篇参考的文

    2024年02月05日
    浏览(35)
  • 【Stable Diffusion】Stable Diffusion各类模型描述

    Stable Diffusion 是一种新型的生成模型,它可以用于生成高质量的图像、文本和音频等多种形式的数据。目前已经出现了许多基于 Stable Diffusion 模型的变种,下面简单介绍其中几种比较流行的模型: 模型链接:https://huggingface.co/stabilityai DDIM 是 Stable Diffusion 的第一个应用,它采用

    2024年02月16日
    浏览(34)
  • 【Stable Diffusion】Stable Diffusion免安装在线部署教程

    一、开启Google Colab网址 官网:https://colab.research.google.com/ 点击添加代码: 二、执行如下代码指令 点击执行按钮 会自动安装相关的套件、模型,然后等待运行完 注意:如果发生如下错误,该如何解决 RuntimeError:No CUDA GPUs are available 解决办法: 1、点击右上角点选硬件资源 2、

    2024年02月04日
    浏览(36)
  • Stable Diffusion 安装教程(详细)_stable diffusion安装

    引言 如果你只想简单尝试一下,仅仅图一乐,可以通过网页在线体验Stable Diffusion,可以今日免费的网站进行使用(https://stablediffusionweb.com/),只是功能不如本地的多。 本地部署安装Stable Diffusion有很多种方式,例如安装启动器,安装传统的Web Ui界面等等,它们的步骤看似繁

    2024年02月19日
    浏览(38)
  • Stable Diffusion stable-diffusion-webui开发笔记

    Stable Diffusion用来文字生成图片,ControlNet就是用来控制构图的,LoRA就是用来控制风格的 。 国内加速官网: mirrors / AUTOMATIC1111 / stable-diffusion-webui · GitCode 安装参考: Stable Diffusion安装与常见错误(+Lora使用)2023年最新安装教程_cycyc123的博客-CSDN博客 保姆级教程:从0到1搭建St

    2024年02月10日
    浏览(41)
  • 【Stable Diffusion】Windows端纯净版Stable Diffusion安装教程

    因为我们目前安装的Stable Diffusion和市面上的其他AIGC工具不同,他是在GitHub上的一个开源项目需要在自己的电脑环境配置Python和Git之后进行安装来利用自己电脑的性能进行图像生成,而其他AIGC工具一般是在其公司提供的云服务器上进行计算生成。因此我们使用Stable Diffusion时候

    2024年02月02日
    浏览(36)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包