提示词原理#
图像生成器#
information creator 完全在图像信息空间(或潜伏空间)中工作。这一特性使它比以前在像素空间工作的扩散模型更快。在技术上,这个组件是由一个 UNet 神经网络和一个调度算法组成的。
Text Encoder#
提示词的解析由 Text Encoder/CLIP 处理 (token embedding),这里是提示词转译给 AI 的关键一步。
ClipText 用于文本编码。
输入文本,输出 77 个标记嵌入向量,每个都有 768 个维度。
information creator#
UNet + Scheduler 在信息(潜在)空间中逐步处理/分散信息。
它输入文本嵌入和一个由噪声组成的起始多维数组(结构化的数字列表,也叫张量),输出一个经过处理的信息阵列。
Image Decoder#
Text Decoder 根据从 information creator 那里获得的信息绘制一幅图画。 它只在过程结束时运行一次以生成最终图像。
Autoencoder Decoder 使用处理过的信息阵列绘制最终图像的解码器。输入处理过的信息阵列 (dimensions: (4,64,64)),输出结果图像 (dimensions: (3, 512, 512),即 (red/green/blue, width, height)。
CLIP 的工作#
CLIP 训练图 from CLIP:多模态领域革命者-云社区-华为云
Stable Diffusion 中使用的自动编码器的缩减系数为 8。这意味着一张 (4, 512, 512) 的图像在潜在空间中是 (4, 64, 64)。
在使用稳定扩散推理一张 512 x 512 的图片的过程中,模型用一个种子和一个文本提示作为输入。潜在种子生成大小 64 × 64 的随机潜在图像,而 prompt 进入 Text Encoder 通过 CLIP 的文本编码器转化为大小为 77 × 768 的文本嵌入。
U-Net 在以文本嵌入为条件的同时迭代地对随机高斯噪声表示进行去噪。U-Net 通过 采样算法 计算去噪的潜在图像表示,输出噪声残差。这个步骤重复许多次后,潜在表示由 Image Decoder 的 auto encoder 的解码器解码输出。
扩展阅读:
- 什么是扩散模型?
- illustrated-stable-diffusion
- 稳定扩散
- 稳定扩散入门
- Stable Diffusion From Wikipedia
WebUI 的实现#
WebUI 的 prompt_parser 通过本地 WebUI 实现了渐变等功能。
WebUI prompt 语法会转换为相应时间的 prompt,然后通过 embedding 交给 Ai 处理。
关于权重的实现:权重增加通常会占一个提示词位。
关于渐变的实现:到了指定 Step,WebUI 程序会替换对应提示词,达到渐变效果。
其他以此类推。
整个看下来,原理流程如图
By RcINS
你可以在 illustrated-stable-diffusion 看到全面的介绍。本节部分内容也是由此翻译。
良好参数(风格趋向插画)#
an extremely delicate and beautiful
- 绘画媒介全分类
- 动漫人物/艺术家/风格化列表/Pt 文件
- 风格化:人偶教室
- 风格化,日语 Wiki
- 风格化: 32 种
- 艺术家列表/SD1.4
- 艺术家列表/SD1.4/1,833 位艺术家
- 艺术家博物馆
草图风格#
词 | 描述 |
---|---|
sketch | 可以让图片看起来像随手画的草稿 |
lineart | 可以让线条变得很粗 |
posing sketch, monochrome | 黑白草图 |
rough sketch | 上了颜色的草图 |
monochrome+lineart | 情况下一般只会让眼睛上色,强调发色后头发也可以上色 |
monochrome, gray scale, pencil sketch lines | 做出的铅笔速写的感觉 |
利用 sketch,pastel color,lineart 的 tag 模拟一张图的绘画过程文章来源:https://www.toymoban.com/news/detail-493360.html
艺术风格#
词 | 描述 |
---|---|
chibi | 可以画出低头身比的效果(二头身, 三头身) |
watercolor pencil | 可以生成彩铅画 |
faux traditional media | 可以做出签绘的风格 |
anime screeshot, | 可以让画面变成动画风格 |
retro artstyle | 赛璐璐风 |
photorealistic, painting, realistic, sketch, oil painting | 厚涂 |
pastel color 和 sketch | 搭配会有速涂的质感 |
杂志/设定集 风格#
词 | 描述 |
---|---|
official art | 变得更加官方一点 |
three views from front, back and side 和 costume setup materials | 可以用来生成设定图 |
multiple views | 会出现类似设定图 |
character sheet | 会出现设定图 |
magazine cover | 会把背景换成杂志封面, 配合 office art 更像真实杂志(虽然字没法看) |
magazine scan | 类似杂志内页的风格 |
posing | 会强调有一个动作, 不至于出现混乱的动作(露出有六个手指头的手) |
caustics | 画面向主题聚焦, 类似海报 |
常用参数: SFW#
人物数量 | 描述 |
---|---|
数量 | one boy / one girl / two boy / two girl (one_boy_one_girl 是错误的) |
人物画风 | 描述 |
---|---|
质量提升参数 | masterpiece, best quality |
原神 | Genshin Impact |
萝莉 | female child , loli (画风差) |
人物样貌 | 描述 |
---|---|
头发 | hair |
长发 | longhair |
短发 | shorthair |
眼睛 | eyes |
渐变颜色长发 | gradient pink longhair |
渐变颜色眼睛 | gradient pink eyes |
粗眉毛 | thick eyebrows |
猫尾巴 | cat tail |
猫耳朵 | cat ears |
动物耳朵 | animal ears |
毛茸茸的动物耳朵 | animal ear fluff |
刘海 | bangs |
两眼之间的头发 | hair between eyes |
眉毛后面的头发 | eyebrows behind hair |
锁骨 | collarbone |
斗篷(要在很前面才有效) | cape |
乳房尺寸 | small breasts |
出汗 | sweating |
颜色丝袜(和长丝袜冲突) | white stockings , black stockings |
长丝袜 | thighhighs |
女仆 | maid |
发带 | ribbon |
爱心眼 | heart-shaped pupils |
御姐/JK/辣妹? | gyaru |
肌肉发达 | muscular |
天使翅膀(要是形容人的第一个才正常) | angel wings |
颜色内裤(赠内衣) | pink underpants |
肚脐 | navel |
颈部颜色项圈 | white collar |
黑色皮肤 | dark skin |
撕裂的衣服 | torn clothes |
撕裂的裤子 | torn legwear |
开襟夹克(配合叉开腿特色) | open jacket |
异色瞳 | heterochromia_blue_red |
吊袜带(会和内衣冲突) | garter straps |
靴子 | boots |
眼罩 | blindfold |
流泪 | tears |
项链 | necklace |
眼镜 | glasses |
比基尼 | bikini |
湿衣服 | wet clothes |
透明衣物 | transparent raincoat , transparent jacket , transparent tshirt |
唾液(自动伸舌头) | saliva |
流口水(和唾液冲突) | drooling |
水手服 | sailor dress |
环境样式 | 描述 |
---|---|
在床上 | on bed |
光线反射 | reflection light |
赛博朋克 | cyberpunk, city, kowloon, rain |
在地毯上 | on carpet |
在瑜伽垫上(它分不清什么是瑜伽垫,只知道色块比较大,所以要配合 one girl 用) | on_yoga_mats |
人物视角 | 描述 |
---|---|
正面视角 | from viewer |
从上到下视角 | from below |
全身 | full body |
人物状态 | 描述 |
---|---|
叉开腿 | spread leg |
露出腋下 | armpits |
举起手 | hands up, arms up |
爪子手 | paw pose |
站立 | standing |
行走 | walking |
吐舌头 | tongue out |
抬起腿 | legs up |
手放背后 | arms behind back, hidden hands |
衬衫 | shirt |
长袖 | long sleeves |
连帽衫 | hoodie |
褶边 | frills |
喇叭裤 | bloomers |
白色连衣裙 | white dress |
捆绑 | bondage , bondage body , bondage foot , bondage hand |
蹲下 | crouch , squatting |
真画风 | photorealistic |
跪下 | kneel down |
湿身 | wet body |
提示词速查#
- 手抄本法术书
- Danbooru 全部 Tag 列表
- 参数法术全典
- Tag 在线协作
- NSFWTag
- AI 艺术家文档
- Novelai 关键词组合器
调参工程师#
- emphasis 测试
- 面向 NAI 的测试
- GitHub - Maks-s/sd-akashic: A compendium of informations regarding Stable Diffusion (SD)
- GitHub - willwulfken/MidJourney-Styles-and-Keywords-Reference: A reference containing Styles and Keywords that you can use with MidJourney AI. There are also pages showing resolution comparison, image weights, and much more!
转发自AiDraw | AiDraw文章来源地址https://www.toymoban.com/news/detail-493360.html
到了这里,关于stable diffusion(杂谈)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!