stable diffusion(杂谈)

这篇具有很好参考价值的文章主要介绍了stable diffusion(杂谈)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

提示词原理#

图像生成器#

stable diffusion(杂谈)

information creator 完全在图像信息空间(或潜伏空间)中工作。这一特性使它比以前在像素空间工作的扩散模型更快。在技术上,这个组件是由一个 UNet 神经网络和一个调度算法组成的。

Text Encoder#

提示词的解析由 Text Encoder/CLIP 处理 (token embedding),这里是提示词转译给 AI 的关键一步。

ClipText 用于文本编码。

输入文本,输出 77 个标记嵌入向量,每个都有 768 个维度。

information creator#

UNet + Scheduler 在信息(潜在)空间中逐步处理/分散信息。

它输入文本嵌入和一个由噪声组成的起始多维数组(结构化的数字列表,也叫张量),输出一个经过处理的信息阵列。

Image Decoder#

Text Decoder 根据从 information creator 那里获得的信息绘制一幅图画。 它只在过程结束时运行一次以生成最终图像。

Autoencoder Decoder 使用处理过的信息阵列绘制最终图像的解码器。输入处理过的信息阵列 (dimensions: (4,64,64)),输出结果图像 (dimensions: (3, 512, 512),即 (red/green/blue, width, height)。

CLIP 的工作#

stable diffusion(杂谈)

CLIP 训练图 from CLIP:多模态领域革命者-云社区-华为云

Stable Diffusion 中使用的自动编码器的缩减系数为 8。这意味着一张 (4, 512, 512) 的图像在潜在空间中是 (4, 64, 64)。

在使用稳定扩散推理一张 512 x 512 的图片的过程中,模型用一个种子和一个文本提示作为输入。潜在种子生成大小 64 × 64 的随机潜在图像,而 prompt 进入 Text Encoder 通过 CLIP 的文本编码器转化为大小为 77 × 768 的文本嵌入。

U-Net 在以文本嵌入为条件的同时迭代地对随机高斯噪声表示进行去噪。U-Net 通过 采样算法 计算去噪的潜在图像表示,输出噪声残差。这个步骤重复许多次后,潜在表示由 Image Decoder 的 auto encoder 的解码器解码输出。

stable diffusion(杂谈)

扩展阅读:

  • 什么是扩散模型?
  • illustrated-stable-diffusion
  • 稳定扩散
  • 稳定扩散入门
  • Stable Diffusion From Wikipedia

WebUI 的实现#

WebUI 的 prompt_parser 通过本地 WebUI 实现了渐变等功能。

WebUI prompt 语法会转换为相应时间的 prompt,然后通过 embedding 交给 Ai 处理。

关于权重的实现:权重增加通常会占一个提示词位。

关于渐变的实现:到了指定 Step,WebUI 程序会替换对应提示词,达到渐变效果。

其他以此类推。

整个看下来,原理流程如图

stable diffusion(杂谈)

By RcINS

你可以在 illustrated-stable-diffusion 看到全面的介绍。本节部分内容也是由此翻译。

良好参数(风格趋向插画)#

an extremely delicate and beautiful
  • 绘画媒介全分类
  • 动漫人物/艺术家/风格化列表/Pt 文件
  • 风格化:人偶教室
  • 风格化,日语 Wiki
  • 风格化: 32 种
  • 艺术家列表/SD1.4
  • 艺术家列表/SD1.4/1,833 位艺术家
  • 艺术家博物馆

草图风格#

描述
sketch 可以让图片看起来像随手画的草稿
lineart 可以让线条变得很粗
posing sketch, monochrome 黑白草图
rough sketch 上了颜色的草图
monochrome+lineart 情况下一般只会让眼睛上色,强调发色后头发也可以上色
monochrome, gray scale, pencil sketch lines 做出的铅笔速写的感觉

利用 sketch,pastel color,lineart 的 tag 模拟一张图的绘画过程

艺术风格#

描述
chibi 可以画出低头身比的效果(二头身, 三头身)
watercolor pencil 可以生成彩铅画
faux traditional media 可以做出签绘的风格
anime screeshot, 可以让画面变成动画风格
retro artstyle 赛璐璐风
photorealistic, painting, realistic, sketch, oil painting 厚涂
pastel color 和 sketch 搭配会有速涂的质感

杂志/设定集 风格#

描述
official art 变得更加官方一点
three views from front, back and side 和 costume setup materials 可以用来生成设定图
multiple views 会出现类似设定图
character sheet 会出现设定图
magazine cover 会把背景换成杂志封面, 配合 office art 更像真实杂志(虽然字没法看)
magazine scan 类似杂志内页的风格
posing 会强调有一个动作, 不至于出现混乱的动作(露出有六个手指头的手)
caustics 画面向主题聚焦, 类似海报

常用参数: SFW#

人物数量 描述
数量 one boy / one girl / two boy / two girl (one_boy_one_girl 是错误的)
人物画风 描述
质量提升参数 masterpiece, best quality
原神 Genshin Impact
萝莉 female child , loli (画风差)
人物样貌 描述
头发 hair
长发 longhair
短发 shorthair
眼睛 eyes
渐变颜色长发 gradient pink longhair
渐变颜色眼睛 gradient pink eyes
粗眉毛 thick eyebrows
猫尾巴 cat tail
猫耳朵 cat ears
动物耳朵 animal ears
毛茸茸的动物耳朵 animal ear fluff
刘海 bangs
两眼之间的头发 hair between eyes
眉毛后面的头发 eyebrows behind hair
锁骨 collarbone
斗篷(要在很前面才有效) cape
乳房尺寸 small breasts
出汗 sweating
颜色丝袜(和长丝袜冲突) white stockings , black stockings
长丝袜 thighhighs
女仆 maid
发带 ribbon
爱心眼 heart-shaped pupils
御姐/JK/辣妹? gyaru
肌肉发达 muscular
天使翅膀(要是形容人的第一个才正常) angel wings
颜色内裤(赠内衣) pink underpants
肚脐 navel
颈部颜色项圈 white collar
黑色皮肤 dark skin
撕裂的衣服 torn clothes
撕裂的裤子 torn legwear
开襟夹克(配合叉开腿特色) open jacket
异色瞳 heterochromia_blue_red
吊袜带(会和内衣冲突) garter straps
靴子 boots
眼罩 blindfold
流泪 tears
项链 necklace
眼镜 glasses
比基尼 bikini
湿衣服 wet clothes
透明衣物 transparent raincoat , transparent jacket , transparent tshirt
唾液(自动伸舌头) saliva
流口水(和唾液冲突) drooling
水手服 sailor dress
环境样式 描述
在床上 on bed
光线反射 reflection light
赛博朋克 cyberpunk, city, kowloon, rain
在地毯上 on carpet
在瑜伽垫上(它分不清什么是瑜伽垫,只知道色块比较大,所以要配合 one girl 用) on_yoga_mats
人物视角 描述
正面视角 from viewer
从上到下视角 from below
全身 full body
人物状态 描述
叉开腿 spread leg
露出腋下 armpits
举起手 hands up, arms up
爪子手 paw pose
站立 standing
行走 walking
吐舌头 tongue out
抬起腿 legs up
手放背后 arms behind back, hidden hands
衬衫 shirt
长袖 long sleeves
连帽衫 hoodie
褶边 frills
喇叭裤 bloomers
白色连衣裙 white dress
捆绑 bondage , bondage body , bondage foot , bondage hand
蹲下 crouch , squatting
真画风 photorealistic
跪下 kneel down
湿身 wet body

提示词速查#

  • 手抄本法术书
  • Danbooru 全部 Tag 列表
  • 参数法术全典
  • Tag 在线协作
  • NSFWTag
  • AI 艺术家文档
  • Novelai 关键词组合器

调参工程师#

  • emphasis 测试
  • 面向 NAI 的测试
  • GitHub - Maks-s/sd-akashic: A compendium of informations regarding Stable Diffusion (SD)
  • GitHub - willwulfken/MidJourney-Styles-and-Keywords-Reference: A reference containing Styles and Keywords that you can use with MidJourney AI. There are also pages showing resolution comparison, image weights, and much more!

转发自AiDraw | AiDraw文章来源地址https://www.toymoban.com/news/detail-493360.html

到了这里,关于stable diffusion(杂谈)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Stable Diffusion VAE:改善图像质量的原理、选型与使用指南

    VAE Stable Diffusion(稳定扩散)是一种用于生成模型的算法,结合了变分自编码器(Variational Autoencoder,VAE)和扩散生成网络(Diffusion Generative Network)的思想。它通过对变分自编码器进行改进,提高了生成样本的质量和多样性。 VAE Stable Diffusion的核心思想是使用扩散生成网络来

    2024年02月14日
    浏览(49)
  • 计算机视觉的应用20-图像生成模型(Stable Diffusion)的原理详解与相关项目介绍

    大家好,我是微学AI,今天给大家介绍一下计算机视觉的应用20-图像生成模型:Stable Diffusion模型的原理详解与相关项目介绍。大家知道现在各个平台发的各种漂亮的女生,这些漂亮的图片是怎么生成的吗,其实它们底层原理就是用到了Stable Diffusion模型。 Stable Diffusion是一种基

    2024年04月12日
    浏览(43)
  • 可用于Stable Diffusion免费的AI绘画标签生成器

    这是一个开源项目,借花献佛,基于原作者的基础上进行了微调还有以及修改内容。 支持中英文,权重以及xxxx词汇,老司机都懂。 直接可在右侧根据需求进行点选操作,然后复制到自己的Stable Diffusion中进行AI绘画。 下载压缩包 百度云盘 夸克云盘 安装nmp,如果你机器有的话

    2024年02月09日
    浏览(62)
  • 视觉族: 基于Stable Diffusion的免费AI绘画图片生成器工具

    视觉族是一款基于Stable Diffusion文生图模型的免费在线AI绘画图片生成器工具,可以使用提示快速生成精美的艺术图片,支持中文提示。无论你是想要创作自己的原创作品,还是想要为你的文字增添一些视觉效果,视觉族都可以帮助你实现你的想象。 网址链接:https://

    2024年02月09日
    浏览(60)
  • Stable Diffusion现代人工智能艺术成功背后的物理学原理,破译用于文本到图像生成的著名 AI 模型与物理学中观察到的过程之间的联系

    毫不奇怪地否认本文的许多内容是使用人工智能生成的,当然包括描绘当今数字艺术最大趋势之一的图像。 虽然最近几天迅速传播并融入我们对话中的一些最新语言模型不一定适合图像生成,但本文旨在关注文本到图像 AI,特别是著名的系统“稳定扩散” ”。创意工具市场

    2024年02月11日
    浏览(64)
  • Stable Diffusion 提示词技巧

    随着AI技术的不断发展,越来越多的新算法涌现出来,例如Stable Diffusion、Midjourney、Dall-E等。相较于传统算法如GAN和VAE,这些新算法在生成高分辨率、高质量的图片方面表现更加卓越,把 AI 图像生成又提升了一个新的高度,AI图像生成对各行各业都带来了很重要的影响。如 S

    2024年02月10日
    浏览(40)
  • Stable Diffusion 30分钟打造AI 写真照片生成器|海马体照相馆这次真的要木得了

    这次,海马体照相馆可能真的要木得了!! 前有妙鸭相机这种付费傻瓜式的 AI 写真程序,后有 Stable Diffusion 定制属于自己的 Lora 模型的围攻。 但今天要分享的确实一个叫 EasyPhoto 的 AI 写真照片生成器! 免费,使用起来却非常简单。 EasyPhoto 是一款 Stable diffusion 插件,用于生

    2024年02月21日
    浏览(81)
  • stable diffusion实践操作-提示词

    stable diffusion实践操作 stable diffusion实践操作-提示词-人物属性 stable diffusion实践操作-提示词-人物服饰 stable diffusion实践操作-提示词-整体环境 stable diffusion实践操作-提示词-图片结构 stable diffusion实践操作-CLIP 本文专门开一节写提示词相关的内容. SD提示词是以词组作为单位的,

    2024年02月09日
    浏览(48)
  • Stable Diffusion 提示词入门指南

    本文主要讲解 Stable Diffusion (下文简称 SD)提示词的用法,帮助大家生成更高质量的图片 本章节主要讲解文生图,其他类型读者可以自行探索。同时本文主要是以 Stable Diffusion Discard 的形式生成图片 如果各位对于图片隐私性、图片版权问题有要求,或是需要能力更加强大、更

    2024年02月09日
    浏览(36)
  • AI 绘画 | Stable Diffusion 提示词

    在Stable Diffusion中,Prompts是控制模型生成图像的关键输入参数。它们是一种文本提示,告诉模型应该生成什么样的图像。 Prompts可以是任何文本输入,包括描述图像的文本,如“一只橘色的短毛猫,坐在草地上,背景是蓝天白云”,也可以是的组合,如“鸟,森林,天空

    2024年01月21日
    浏览(53)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包