Fooocus入坑指南-对SDXL支持最棒的UI工具

这篇具有很好参考价值的文章主要介绍了Fooocus入坑指南-对SDXL支持最棒的UI工具。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

SDXL的之旅

最新发布的SDXL(Stable Diffusion X Language)要解决更精准地控制它生成我们想要的图片。SDXL理解自然语言描述,并可精确控制Stable Diffusion输出特定风格和内容的图像。只需简单的自然语言,你就可以生成理想中的场景、人物、物体等。

相比于原版Stable Diffusion,SDXL增强了对语义和细节的控制能力。它内置了对各种艺术流派、风格的理解, véritablement你的创意想法变为可视化的图像。从生成写实人像到拟真风景,从印象派绘画到8位像素艺术,SDXL为Stable Diffusion加入了无限可能。

作为Stable Diffusion的升级,SDXL带来了更人性化的交互方式和前所未有的创作精度。想探索这个奇妙工具带来的无限创作乐趣吗? 让我们开始SDXL之旅。

UI的选择

社区上一直关注的都是web UI和comfyUI的比较,我也一样,但我也希望能找到一个结合二者优势的工具,很碰巧,我发现了Fooocus。

然而实际学习过程中我发现很多人误解了fooocus,它的目标好像更大更宏伟,它视为对手的是Stable diffusion和minjourney。

FOOOCUS的自我介绍

Fooocus是一款图像生成软件。

Fooocus是对Stable Diffusion和Midjourney的设计的重新思考:

  1. 从Stable Diffusion中学到的,该软件是离线的、开源的,而且免费的。
  2. 从Midjourney中学到的,不需要手动调整,用户只需专注于提示和图像。

Fooocus包含并自动化了许多内部优化和质量改进。用户可以忘记所有那些复杂的技术参数,只需享受人与计算机之间的互动,以“探索思维的新媒体并拓展人类的想象力”[1]。

Fooocus简化了安装过程。在点击“下载”和生成第一张图像之间,所需的鼠标点击次数严格限制在不到3次以内。最低的GPU内存要求是4GB(Nvidia)。

Fooocus还为高级用户开发了许多“Fooocus专属”功能,以获得完美的结果。点击这里浏览高级功能。、

Fooocus的实践

Fooocus的安装

软件的安装非常简单,首先下载对应操作系统的安装文件,软件包大概1.6G,

软件下载 :

https://github.com/lllyasviel/Fooocus/releases/download/release/Fooocus_win64_2-0-0.7z​github.com/lllyasviel/Fooocus/releases/download/release/Fooocus_win64_2-0-0.7z

Fooocus的启动

直接在解压路径下运行run.bat就行,但是启动时会自动下载几个SDXL的模型文件。因为默认是从huggingface下载,速度较慢,所以建议各位下载好了直接拷贝到.\Fooocus\models\checkpoints的路径下。通过启动下载不仅慢,而且没有断点续传,用下载工具则方便的多。

另外需要注意一点,有些同学之前下载过更新版本的SDXL的base和refiner模型,不想用0.9的模型,那可以直接修改launch.py文件,改成自己版本的就行。找到下面这个代码段,修改就可以了。

model_filenames = [
    ('sd_xl_base_1.0_0.9vae.safetensors',
     'https://huggingface.co/stabilityai/stable-diffusion-xl-base-1.0/resolve/main/sd_xl_base_1.0_0.9vae.safetensors'),
    ('sd_xl_refiner_1.0_0.9vae.safetensors',
     'https://huggingface.co/stabilityai/stable-diffusion-xl-refiner-1.0/resolve/main/sd_xl_refiner_1.0_0.9vae.safetensors')
]

Fooocus的自动更新

Fooocus会自动更新,这点大家要注意了。它的run.bat里面首先就是检查自己git是否发布了最新版本,然后更新代码,如果大家不想更新那么快,可以通过修改源码绕过更新。

Fooocus的远程访问

默认情况下,只能本机访问,但是可以修改webui.py来共享你本机的实例,最简单就是修改最后一句话

shared.gradio_root.launch(inbrowser=True, server_name="0.0.0.0", server_port=7880, share=True)

Fooocus的使用

启动完成,会自动弹出访问页面,

fooocus,Stable diffusion,stable diffusion,AIGC,人工智能,midjourney

为什么这么简洁,看惯了SD的复杂界面,看这个简直有点不知所措。试着来一个,a tiger in the forest.

fooocus,Stable diffusion,stable diffusion,AIGC,人工智能,midjourney

fooocus,Stable diffusion,stable diffusion,AIGC,人工智能,midjourney

fooocus,Stable diffusion,stable diffusion,AIGC,人工智能,midjourney

直观感受,画质非常清晰,理解语义也很准确,不需要反向提示词。再来试试人物的,a chinese girl riding a tiger in ancient myth story

fooocus,Stable diffusion,stable diffusion,AIGC,人工智能,midjourney

感觉人物面部还是不够精细。来个人像的吧。raw photo, masterpiece, chinese girl , wearing high-class business/working suit, simple background, high-class pure color background, solo, medium shot, high detail face, looking straight into the camera with shoulders parallel to the frame, slim body, photorealistic, best quality

fooocus,Stable diffusion,stable diffusion,AIGC,人工智能,midjourney

fooocus,Stable diffusion,stable diffusion,AIGC,人工智能,midjourney

fooocus,Stable diffusion,stable diffusion,AIGC,人工智能,midjourney

从单独的人物面部效果来看SDXL确实更胜一筹

感觉人物刻画的还不错,但是背景没有达到我们想要的效果。打开高级选项,

fooocus,Stable diffusion,stable diffusion,AIGC,人工智能,midjourney

发现所有的高级选项都在这里,也看到了fooocus设计的良苦用心。为什么给的是图片尺寸固定模型,从SDXL的官方信息可知,SDXL训练的数据包含以下尺寸,都是1024*1024像素训练的,所以最好还是要和这个像素匹配的分辨率。

fooocus,Stable diffusion,stable diffusion,AIGC,人工智能,midjourney

改变自己 改变人生:为什么使用SDXL-学习笔记0 赞同 · 0 评论文章​编辑

fooocus,Stable diffusion,stable diffusion,AIGC,人工智能,midjourney

官方建议分辨率,Fooocus其实是做了扩展。2048*512这种太少人用了。

如果你想增加其它的尺寸,也没什么难的,只需要修改\Fooocus\modules\sdxl_styles.py里面943行,这段定义就可以了。

SD_XL_BASE_RATIOS = {
    "0.5": (704, 1408),
    "0.52": (704, 1344),
    "0.57": (768, 1344),
    "0.6": (768, 1280),
    "0.68": (832, 1216),    
    ......
    "4.0": (2048,512)  # 我们增加的尺寸
}

setting菜单,设置。

performance性能:速度(优先);质量(优先)

Aspect Ratios (width × height):图片尺寸

Image Number:出图数量

Negative Prompt:反向提示词

Random:随机种子,选中后,可以固定seed值

fooocus,Stable diffusion,stable diffusion,AIGC,人工智能,midjourney

Style风格

这里面的风格我统计了一下,大概有184个风格可以选择,这里面fooocus的目的是让用户不需要再为风格的关键词来费脑筋,看看几个风格的出图,我们还是老虎为题,只是风格不同,提示词只有个tiger

fooocus,Stable diffusion,stable diffusion,AIGC,人工智能,midjourney

SAI-3D art

fooocus,Stable diffusion,stable diffusion,AIGC,人工智能,midjourney

sai-line art

fooocus,Stable diffusion,stable diffusion,AIGC,人工智能,midjourney

sai-neonpunk

fooocus,Stable diffusion,stable diffusion,AIGC,人工智能,midjourney

futuristic-biomechanical 未来生物机械

fooocus,Stable diffusion,stable diffusion,AIGC,人工智能,midjourney

ads-advertising

fooocus,Stable diffusion,stable diffusion,AIGC,人工智能,midjourney

artstyle-pop art:以大众文化和消费为主题,通过大胆的颜色、图案和扁平化的造型来表现

fooocus,Stable diffusion,stable diffusion,AIGC,人工智能,midjourney

Macro Photography(摄影技术,主要用于拍摄极小物体的特写照片。这种摄影风格的目标是在高度放大的情况下捕捉物体的微小细节,使观众能够看到平常情况下肉眼无法察觉的细节和纹理)

fooocus,Stable diffusion,stable diffusion,AIGC,人工智能,midjourney

misc-lovecraftian(恐怖、神秘,科幻元素)

fooocus,Stable diffusion,stable diffusion,AIGC,人工智能,midjourney

赛博朋克风格的机器

fooocus,Stable diffusion,stable diffusion,AIGC,人工智能,midjourney

"artstyle-impressionist" 法国印象派艺术风格,如莫奈

fooocus,Stable diffusion,stable diffusion,AIGC,人工智能,midjourney

game-bubble bobble 泡泡游戏

fooocus,Stable diffusion,stable diffusion,AIGC,人工智能,midjourney

格斗游戏风格

fooocus,Stable diffusion,stable diffusion,AIGC,人工智能,midjourney

马里奥游戏风

fooocus,Stable diffusion,stable diffusion,AIGC,人工智能,midjourney

Terragen(一种专业的3D环境生成和渲染软件。它主要用于创建和渲染高质量的自然环境和风景)

fooocus,Stable diffusion,stable diffusion,AIGC,人工智能,midjourney

fooocus,Stable diffusion,stable diffusion,AIGC,人工智能,midjourney

Paper-cut

风格页面的设计我倒觉得Foocus更希望专业美术人可以利用,因为像我这样的技术人员,对于风格的理解都需要通过chatglm这样对话类AI才行。

关于Style的内置prompts

这块是以后SDXL都会通用的模式,利用内置prompts来表示style,这也是基于stable diffusion的AIGC一个发展趋势,大家可以通过学习他们的prompts来提示自己的prompts水平。这个文件是Fooocus\modules\sdxl_styles.py,大家用python编辑器或者其它编辑器可以看一下,是json格式。我给大家展示一部分style的prompts

 {
        "name": "cinematic-default",
        "prompt": "cinematic still {prompt} . emotional, harmonious, vignette, highly detailed, high budget, bokeh, cinemascope, moody, epic, gorgeous, film grain, grainy",
        "negative_prompt": "anime, cartoon, graphic, text, painting, crayon, graphite, abstract, glitch, deformed, mutated, ugly, disfigured"
    },
    {
        "name": "sai-3d-model",
        "prompt": "professional 3d model {prompt} . octane render, highly detailed, volumetric, dramatic lighting",
        "negative_prompt": "ugly, deformed, noisy, low poly, blurry, painting"
    },
    {
        "name": "sai-analog film",
        "prompt": "analog film photo {prompt} . faded film, desaturated, 35mm photo, grainy, vignette, vintage, Kodachrome, Lomography, stained, highly detailed, found footage",
        "negative_prompt": "painting, drawing, illustration, glitch, deformed, mutated, cross-eyed, ugly, disfigured"
    },
    {
        "name": "sai-anime",
        "prompt": "anime artwork {prompt} . anime style, key visual, vibrant, studio anime,  highly detailed",
        "negative_prompt": "photo, deformed, black and white, realism, disfigured, low contrast"
    },
    {
        "name": "sai-cinematic",
        "prompt": "cinematic film still {prompt} . shallow depth of field, vignette, highly detailed, high budget, bokeh, cinemascope, moody, epic, gorgeous, film grain, grainy",
        "negative_prompt": "anime, cartoon, graphic, text, painting, crayon, graphite, abstract, glitch, deformed, mutated, ugly, disfigured"
    },
    {
        "name": "sai-comic book",
        "prompt": "comic {prompt} . graphic illustration, comic art, graphic novel art, vibrant, highly detailed",
        "negative_prompt": "photograph, deformed, glitch, noisy, realistic, stock photo"
    },
    {
        "name": "sai-craft clay",
        "prompt": "play-doh style {prompt} . sculpture, clay art, centered composition, Claymation",
        "negative_prompt": "sloppy, messy, grainy, highly detailed, ultra textured, photo"
    },

学到了吧,这些prompts拿到sd1.5里面也可以用。这就是所谓的前人栽树后人乘凉。

高级选项

基础模型和refiner模型,可选Loras,有五个。

fooocus,Stable diffusion,stable diffusion,AIGC,人工智能,midjourney

我在C站找了一个卡通化人物的Lora,文件下载后拷贝到\Fooocus\models\loras目录,点击刷新(Refresh all files)按钮,就可以选择下载的Lora了。

fooocus,Stable diffusion,stable diffusion,AIGC,人工智能,midjourney

SDXL-Caricaturized-Lora.safetensors出图效果如下。按照给的prompts出图,

fooocus,Stable diffusion,stable diffusion,AIGC,人工智能,midjourney

无Lora的效果

fooocus,Stable diffusion,stable diffusion,AIGC,人工智能,midjourney

增加漫画风格Lora的效果

fooocus,Stable diffusion,stable diffusion,AIGC,人工智能,midjourney

增加了写实照片风格Lora的效果

注意:在C站下载模型,Lora的时候一定要找XL版本的。

最后一个sampling sharpness,作者还在github网站上做了专门的讲解。通过这个数值可以调节图片的细节。

我们来看看对比一下效果,

fooocus,Stable diffusion,stable diffusion,AIGC,人工智能,midjourney

这是sampling sharpness 分别是6, 10,20的区别,越大细节越多。

总结

今天对于Fooocus的只是粗浅的了解。后面会继续深入学习和了解。从目前直观的感受,Fooocus是比较忠于SDXL的思想的,通过风格化的设定,控制出图预期,减少出图的不可预知性。文章来源地址https://www.toymoban.com/news/detail-774476.html

到了这里,关于Fooocus入坑指南-对SDXL支持最棒的UI工具的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • AI绘画|免费开源!一键部署的AI绘画工具Fooocus

      该项目发布仅仅一周便在Github上收获了超过6k的star!! 其爆火的背后和Fooocus的三个特点分不开: 发扬了Stable Diffusion的开源精神, 无需联网,本地部署,即可免费使用 。 受到Midjourney的启发, 不再需要手动调整各种复杂的参数 ,用户只需专注于Prompt和图像。 Fooocus简化了

    2024年02月03日
    浏览(67)
  • 【C++ 入坑指南】(05)数据类型

    C++ 规定在创建一个变量或常量时,必须要指定出相应的数据类型,否则无法给变量分配内存。 作用 :整型变量表示的是整数类型的数据。 C++ 中能够表示整型的类型有以下几种方式, 区别在于所占内存空间不同 。 注意:不同系统会有所差异,一字节为 8 位。 数据类型 占用

    2024年02月05日
    浏览(19)
  • 【数据仓库】BI看板DataEase入坑指南

            开头夸夸国产开源BI软件DataEase,支持常见各种报表,还支持图表联动和上下级钻取,超赞有木有!!!         再来为什么说入坑,源码启动各种不服啊。本地用的maven3.5一直导入不了Java项目backend。后来看了官网bilibili源码启动视频,搞了1个多小时。注意和

    2024年02月16日
    浏览(43)
  • 【2023.7.29】浅谈手办——新人入坑指南

    出于对动漫的热爱,相信很多人都会买手办,本人在大一时开始入手了第一个手办,超大猿王路飞(高约50cm),当时对手办还不是很了解,只知道存在正版、非正版区分,但是由于最近又开始入坑,对手办的了解慢慢开始细化起来,所以写一篇文章整理一下目前了解到的,以

    2024年02月15日
    浏览(32)
  • Stable Diffusion - Stable Diffusion WebUI 支持 SDXL 1.0 模型的环境配置

    欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/132056980 SDXL 1.0 版本 是 Stable Diffusion 的最新版本,是基于潜在扩散模型的文本到图像生成技术,能够根据输入的任何文本生成高分辨率、高质量、高多样性的图像,具有以下特点: 更好的成

    2024年02月14日
    浏览(35)
  • 关于windows上Python3.12.0安装FastAPI入坑指南

    #工作笔记#  先说下起因: 年前兄弟说有个webapi的需求看怎么解决,抽空想到Python比较容易上手,而且FastAPI性能号称拥有可与NodeJS和Go并肩的极高性能。 FastAPI官网注明使用 Python 3.8+ ,而我本机又有从Py3.6到Py3.12的每个大版本,见下图 接着入坑开始了。。。 #问题描述: 1 )

    2024年02月22日
    浏览(38)
  • 最好的Vue组件库之Vuetify的入坑指南(持续更新中)

    目录      安装Vuetify      文档结构         快速入门         特性         样式和动画          首先先声明,个人不是什么很牛逼的大佬,只是想向那些想入坑Vuetify的前端新手或者嫌文档太长不知如何入手的人提供一些浅显的建议而已,能让你们稍微少走一些弯

    2024年01月23日
    浏览(27)
  • 【stable diffusion LORA训练】改进lora-scripts,命令行方式训练LORA,支持SDXL训练

    分享下自己改进的一个lora训练脚本,在ubuntu下如果SD-WEBUI的环境已经搭好的话,只需要下载lora-script就可以支持训练了,直接命令行方式训练。 首先,我们需要克隆下项目: git clone https://github.com/Akegarasu/lora-scripts 其次,更改项目里的train.sh脚本如下 根据自己机器的显存适当

    2024年02月03日
    浏览(43)
  • 【kafka-ui】支持kafka with kraft的可视化集群管理工具

    本文在kafka3.3.1版本基础上进行测试 在早期使用kafka的时候一般使用Kafka Tool或者kafka eagle,前者为桌面软件,后者为浏览器软件。总体来说体验一般,但是还比较够用。 但是从kafka3.3.1开始,已经正式抛弃zookeeper使用自己的仲裁器了,但是上述两种kafka可视化工具的更新好像并

    2024年02月02日
    浏览(33)
  • 向量数据库入坑指南:初识 Faiss,如何将数据转换为向量(一)

    我们日常使用的各种 APP 中的许多功能,都离不开相似度检索技术。比如一个接一个的新闻和视频推荐、各种常见的对话机器人、保护我们日常账号安全的风控系统、能够用哼唱来找到歌曲的听歌识曲,甚至就连外卖配送的最佳路线选择也都有着它的身影。 相信很多同学是第

    2024年02月05日
    浏览(33)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包