Midjourney 危!Stable Diffusion-XL 开启公测:会画手、能写字,再也不用写长 prompt 了

这篇具有很好参考价值的文章主要介绍了Midjourney 危!Stable Diffusion-XL 开启公测:会画手、能写字,再也不用写长 prompt 了。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

Midjourney 危!Stable Diffusion-XL 开启公测:会画手、能写字,再也不用写长 prompt 了

转自 | 新智元

编辑 | LRS

【导读】开源、免费的Stable Diffusion就能达到Midjourney水平!

自从Midjourney发布v5之后,在生成图像的人物真实程度、手指细节等方面都有了显著改善,并且在prompt理解的准确性、审美多样性和语言理解方面也都取得了进步。

相比之下,Stable Diffusion虽然免费、开源,但每次都要写一大长串的prompt,想生成高质量的图像全靠多次抽卡。

Midjourney 危!Stable Diffusion-XL 开启公测:会画手、能写字,再也不用写长 prompt 了

最近Stability AI的官宣,正在研发的Stable Diffusion XL开始面向公众测试,目前可以在Clipdrop平台免费试用。

Midjourney 危!Stable Diffusion-XL 开启公测:会画手、能写字,再也不用写长 prompt 了

试用链接:https://clipdrop.co/stable-diffusion

Stability AI的创始人兼首席执行官Emad Mostaque表示,目前该模型仍然处于训练阶段,等参数稳定后将会开源;SD-XL在「握手」等图像细节方面会表现更好,几乎完全可控。

Midjourney 危!Stable Diffusion-XL 开启公测:会画手、能写字,再也不用写长 prompt 了

Stable Diffusion XL也并不是最终发布版的名字,并且也并非是v3,因为SD-XL的架构和SD-v2系列的模型架构非常相似。

Midjourney 危!Stable Diffusion-XL 开启公测:会画手、能写字,再也不用写长 prompt 了

Minimalistic home gym with rubber flooring, wall-mounted TV, weight bench, medicine ball, dumbbells, yoga mats, high-tech equipment, high detail, organized and efficient.

简约的家庭健身房,橡胶地板,壁挂式电视,举重凳,药球,哑铃,瑜伽垫,高科技设备,高细节,组织和效率

下面几张SD-XL官方发布的例图,可以看出图像的质量已经非常能打了。

Midjourney 危!Stable Diffusion-XL 开启公测:会画手、能写字,再也不用写长 prompt 了

Midjourney 危!Stable Diffusion-XL 开启公测:会画手、能写字,再也不用写长 prompt 了

Midjourney 危!Stable Diffusion-XL 开启公测:会画手、能写字,再也不用写长 prompt 了

Midjourney 危!Stable Diffusion-XL 开启公测:会画手、能写字,再也不用写长 prompt 了

不过有时候less并不代表more,有网友认为SD-XL为了摆脱「糟糕的品味」,设定了太多的规则,定制化空间越来越小,不符合大多数人的喜好。目前v1.5的Stable Diffusion仍然是社区内最流行的基座模型。

Midjourney 危!Stable Diffusion-XL 开启公测:会画手、能写字,再也不用写长 prompt 了

网友表示希望新版SD能够和SD 2.1版本的嵌入、hypernetworkds和Lora模型保持兼容,再从零开始重训的话就太难受了。

Midjourney 危!Stable Diffusion-XL 开启公测:会画手、能写字,再也不用写长 prompt 了

也有网友认为,SD-XL的表现和civit网站上网友分享的模型差不多,新模型的效果也并不是特别惊艳,也就是平均水平。

SD-XL:开源版Midjourney

关于Stable Diffusion XL模型的具体信息,官方并没有透露太多,目前只知道是一个与v2模型架构相似、但规模和参数量更大的模型。

SD-v2.1包括9亿参数,SD-XL大约有23亿参数,Emad表示正式版可能会额外发布一个更小的蒸馏版本。

SD-XL相比之前版本的改进如下:

  • 使用较短的描述性prompt即可生成高质量图像

  • 可以生成更贴合prompt的图像

  • 图像中的人体结构更合理

  • 与 v2.1和 v1.5版本(程度较轻)相比,SD-XL生成的图片更符合大众审美

  • 负面提示词(negative prompt)是可选项

  • 生成的肖像图更逼真

  • 图像中的文本更清晰

需要注意的是,SD-XL可能与之前版本的插件不兼容。

清晰可读的文字

在v1系列和v2.1版本的Stable Diffusion模型中,并不具备在图片中生成可读文本的能力。

虽然SD-XL生成的文本信息并不总是准确,但确实得到了巨大的提升。

Midjourney 危!Stable Diffusion-XL 开启公测:会画手、能写字,再也不用写长 prompt 了

Photo of a woman sitting in a restaurant holding a menu that says “Menu”

一个女人坐在餐馆里拿着写着「Menu」的菜单

Midjourney 危!Stable Diffusion-XL 开启公测:会画手、能写字,再也不用写长 prompt 了

Photo of a man holding a sign that says “Stable Diffusion”

一个男人举着写着「Stable Diffusion」的牌子

Midjourney 危!Stable Diffusion-XL 开启公测:会画手、能写字,再也不用写长 prompt 了

a young female holding a sign that says “Stable Diffusion”, highlights in hair, sitting outside restaurant, brown eyes, wearing a dress, side light

一个年轻的女性举着一个牌子,上面写着「Stable Diffusion」,头发高亮,坐在餐厅外面,棕色的眼睛,穿着裙子,侧灯

更好的人体结构

Stable Diffusion在生成人体解剖结构方面一直存在诸多问题,多几条腿、少个胳膊实在是太常见不过的问题,通常需要使用inpaint功能进一步对图像细节进行修正;或者是使用ControlNet的Open Pose功能从参考图像中复制人体的姿态。

比如说SD-v1.5生成瑜伽的图像,经常会出现扭曲的人体。

Midjourney 危!Stable Diffusion-XL 开启公测:会画手、能写字,再也不用写长 prompt 了

Photo of a woman in yoga outfit, triangle pose, beach in evening, rim lighting

一个女人的照片在瑜伽服装,三角形的姿势,海滩在晚上,边缘照明

SD-XL虽然生成的图像并不完美,不过在人体姿态方面已经有了显著的进步。

Midjourney 危!Stable Diffusion-XL 开启公测:会画手、能写字,再也不用写长 prompt 了

更有美感(more aesthetic)

比如同样以屋子为主题,SD-XL可以生成更对称、视觉效果更好的照片。

Midjourney 危!Stable Diffusion-XL 开启公测:会画手、能写字,再也不用写长 prompt 了

SD-XL在肖像照片上也有显著改进。

Midjourney 危!Stable Diffusion-XL 开启公测:会画手、能写字,再也不用写长 prompt 了

photo shot of a woman

一个女人的照片

更贴合prompt的图像

SD-XL可以更好地理解输入的prompt,并生成更精确的图像。

比如以duotone(双色)为例,SD-v1.5只会生成黑白图像,而SD-XL则可以生成具有多种颜色的双色调图像。

与 v1模型相比,理解提示符的能力有所提高。

Midjourney 危!Stable Diffusion-XL 开启公测:会画手、能写字,再也不用写长 prompt 了

duotone portrait of a woman

一个女人的双色调肖像

因为SD-XL同属v2系列模型,所以文本模型尺寸更大,可以比v1模型更好地理解提示词。

Midjourney 危!Stable Diffusion-XL 开启公测:会画手、能写字,再也不用写长 prompt 了

比如下面的例子中,v1.5模型始终无法理解图像中的两个主题(机器人和人类),但SD-XL模型可以生成正常的图像(虽然机器人还是不够big)。

Midjourney 危!Stable Diffusion-XL 开启公测:会画手、能写字,再也不用写长 prompt 了

big robot friend sitting next to a human, ghost in the shell style, anime wallpaper

大机器人朋友坐在人类旁边攻壳机动队风格的动漫壁纸

Midjourney 危!Stable Diffusion-XL 开启公测:会画手、能写字,再也不用写长 prompt 了

a young man, highlights in hair, brown eyes, in white shirt and blue jean on a beach with a volcano in background

一个年轻人,头发染得很亮,棕色眼睛,穿着白衬衫和蓝色牛仔裤,站在海滩上,背景是一座火山

艺术风格

在艺术风格上,SD-XL并没有显著改进,和之前的版本各有千秋。

比如两个模型以不同的角度生成了Edward Hopper风格的图像。

Midjourney 危!Stable Diffusion-XL 开启公测:会画手、能写字,再也不用写长 prompt 了

New York city by Edward Hopper

Edward Hopper绘制的纽约

Leonid Afmov 的风格中,SD-v1.5更准确,SD-XL缺少了不同颜色的笔刷(unmistakable colorful board brushstrokes)。

Midjourney 危!Stable Diffusion-XL 开启公测:会画手、能写字,再也不用写长 prompt 了

New York city by Leonid Afremov

Leonid Afemov绘制的纽约

William-Adolphe Bouguereau风格中,V1.5和SDXL都可以生成一些类似的内容,其中SD-XL更接近Bouguereau创作的经典学院派绘画,并且面部细节更多。

Midjourney 危!Stable Diffusion-XL 开启公测:会画手、能写字,再也不用写长 prompt 了

Portrait of beautiful woman by William-Adolphe Bouguereau

William-Adolphe Bouguereau绘制的美女肖像

风格转变问题

在添加一些无关紧要的关键字后,模型的风格可能会突然转变。

比如先生成一张照片风格的图像。

Midjourney 危!Stable Diffusion-XL 开启公测:会画手、能写字,再也不用写长 prompt 了

a young man, highlights in hair, brown eyes, in white shirt and blue jean on a beach with a volcano in background

一个年轻人,头发染得很亮,棕色眼睛,穿着白衬衫和蓝色牛仔裤,站在海滩上,背景是一座火山

再添加一条黄色的围巾后,图像风格就变成了卡通风格。

Midjourney 危!Stable Diffusion-XL 开启公测:会画手、能写字,再也不用写长 prompt 了

a young man, highlights in hair, brown eyes, wearing a yellow scarf, in white shirt and blue jean on a beach with a volcano in background

一个年轻人,头发染得很亮,棕色的眼睛,围着黄色的围巾,穿着白衬衫和蓝色牛仔裤,站在一个火山为背景的海滩上

问题的故障可能源于预览问题,在正式发布后该问题不知能否得到解决。

参考资料:

https://clipdrop.co/stable-diffusion文章来源地址https://www.toymoban.com/news/detail-498812.html

到了这里,关于Midjourney 危!Stable Diffusion-XL 开启公测:会画手、能写字,再也不用写长 prompt 了的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Midjourney, Stable XL, Dall.E-3文生图三强效果对比

            AI文生图的大争之世,各种文生图的模型此起彼伏,博眼球的更是不在少数。不过目前生成效果最好的依然还是老牌的三强,Midjourney, Stable Diffusion XL,以及Dall.E -3。         我们先来对比一下这三强生成的效果,希望可以为大家在选择图文模型提供一些参考。其

    2024年02月04日
    浏览(24)
  • Stable Diffusion XL 0.9

    虽然此前CEO曾陷入种种争议,但依然不影响Stability AI登上时代杂志。近日,该公司又发布了Stable Diffusion 的XL 0.9版本,35亿+66亿双模型,搭载最大OpenCLIP,让AI生图质量又有了新的飞跃。 Stable Diffusion又双叒升级了! 最近,Stability AI发布了最新版的Stable Diffusion XL 0.9(SDXL 0.9)。

    2024年02月12日
    浏览(29)
  • Stable Diffusion 模型分享:DreamShaper XL(梦想塑造者 XL)

    本文收录于《AI绘画从入门到精通》专栏,专栏总目录:点这里。

    2024年03月24日
    浏览(37)
  • Stable Diffusion XL训练LoRA

    主要包括SDXL模型结构,从0到1训练SDXL以及LoRA教程,从0到1搭建SDXL推理流程。  【一】SDXL训练初识 Stable Diffusion系列模型的训练主要分成一下几个步骤,Stable Diffusion XL也不例外: 训练集制作:数据质量评估,标签梳理,数据清洗,数据标注,标签清洗,数据增强等。 训练文

    2024年02月07日
    浏览(29)
  • Stable Diffusion XL优化终极指南

    如何在自己的显卡上获得SDXL的最佳质量和性能,以及如何选择适当的优化方法和工具,这一让GenAI用户倍感困惑的问题,业内一直没有一份清晰而详尽的评测报告可供参考。直到全栈开发者Félix San出手。 在本文中,Félix介绍了相关SDXL优化的方法论、基础优化、Pipeline优化以

    2024年04月26日
    浏览(27)
  • Stable Diffusion XL(SDXL)原理详解

    😘关注公众号 funNLPer 畅读全文😘 技术报告:SDXL: Improving Latent Diffusion Models for High-Resolution Image Synthesis 官方代码:Stability-AI-generative-models 模型权重:HuggingFace-Stability AI 非官方代码:Linaqruf/kohya-trainer diffuser库:diffusers/pipelines/stable_diffusion_xl

    2024年02月10日
    浏览(36)
  • Stable Diffusion XL on diffusers

    翻译自:https://huggingface.co/docs/diffusers/using-diffusers/sdxl v0.24.0 非逐字翻译 Stable Diffusion XL (SDXL) 是一个强大的图像生成模型,其在上一代 Stable Diffusion 的基础上主要做了如下优化: 参数量增加:SDXL 中 Unet 的参数量比前一代大了 3 倍,并且 SDXL 还引入了第二个 text-encoder(OpenCL

    2024年03月14日
    浏览(29)
  • Stable Diffusion XL 带来哪些新东西?

    前几天写了一篇小短文《 Stable Diffusion 即将发布全新版本》,很快,Stability AI 的创始人兼首席执行官 Emad Mostaque 在一条推文中宣布,Stable Diffusion XL 测试现已可用于公开测试。那么这样一个全新版本会带来哪些新东西,让我们眼见为实吧。 不过在开始之前,简单说明一下:

    2024年02月09日
    浏览(23)
  • Stable Diffusion XL网络结构-超详细

    Stable Diffusion1.5网络结构-超详细原创-CSDN博客 以生成图像1024x1024为例,与SD1.5的3个 CrossAttnDownBlock2D和CrossAttnUpBlock2D 相比,SDXL只有2个,但SDXL的 CrossAttnDownBlock2D模块有了更多的Transformer模块,且只进行了两次下采样,具体的往下看 1.2.1  DownBlock2D 1.2.1.1 ResBolck2D 和SD1.5不一样的是

    2024年04月25日
    浏览(24)
  • Stable Diffusion XL(SDXL)核心基础知识

    Stable Diffusion XL 或 SDXL 是最新的图像生成模型,与以前的 SD 模型(包括 SD 2.1)相比,它专为更逼真的输出而定制,具有更详细的图像和构图。与Stable DiffusionV1-v2相比,Stable Diffusion XL主要做了如下的优化: 对Stable Diffusion原先的U-Net,VAE,CLIP Text Encoder三大件都做了改进: U-N

    2024年02月01日
    浏览(32)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包