Stable Diffusion InstantID 炸裂!只需要一张图就可以换脸 | 详细教程

这篇具有很好参考价值的文章主要介绍了Stable Diffusion InstantID 炸裂!只需要一张图就可以换脸 | 详细教程。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

最近AI换脸又火起来了, 小红书 InstantX 团队发布了一款最新的换脸技术 InstantID

和之前的主流的训练 lora 换脸不同,InstantID 只需要上传一张图就可以实现换脸以及姿势替换!

instantid模型发布,stable diffusion,人工智能,AI作画,AI技术,AIGC

一 InstantID 介绍

instantid模型发布,stable diffusion,人工智能,AI作画,AI技术,AIGC

InstantID 主要分为了三部分

  • ID Embedding:通过预训练的面部识别模型,将语义人脸特征提取为 Face Embedding。这种嵌入包含了丰富的语义信息,如面部特征、表情、年龄等,为后续的图像生成提供了坚实的基础。

  • Image Adapter:引入轻量级的适配模块,将提取的身份信息与文本提示结合。通过解耦的交叉注意力机制,图像和文本能够独立地影响生成过程,同时保持身份信息的同时允许用户对图像风格进行精细控制。

  • IdentityNet:小红书提出的 IdentityNet 是 InstantID 的核心部分。它利用强语义条件和弱空间条件编码参考面部图像的复杂特征。生成过程完全由 Face Embedding 引导,无需文本信息。只更新新添加的模块,而保持预先训练的文本到图像模型冻结,以确保灵活性

概括来说:

  1. InstantID 使用 ID Embedding 提取用户输入的提示词和面部图像的关键信息。

  2. 接着 Image Adapter 将这些信息进行融合

  3. IdentityNet将这些融合后的信息生成新的图像

下面介绍的是使用 Stable Diffusion 如果集成使用 InstantID

目前只支持 SDXL 模型,controlNet 需要升级到V1.1.440版本

二 使用步骤

模型下载

Instant ID提供了两个 ControlNet 模型,考虑到大家的网络原因,我直接放在了网盘,直接后台回复 模型 获取下载链接

  • ip-adapter_instant_id_sdxl.bin

  • majicmixRealistic_v7.safetensors

下载完之后放在你的 {A1111_root}/models/ControlNet 目录下,重启 webui 后在 ControlNet 页面可以看到 InstantId 这个选项 (如果找不到这个选项,需要升级下自己 ControlNet 版本,然后重启即可)

instantid模型发布,stable diffusion,人工智能,AI作画,AI技术,AIGC

参数配置

模型:DreamShaperXL (需要使用一个 sdxl 模型)  
提示词:a 20 yo woman,long hair,dark theme,soothing tones,muted colors,high contrast,(natural skin texture,hyperrealism,soft light,sharp),red background,simple background,  
尺寸:1024x1526  
步数:30  
CFG提示词引导系数:5  

ControlNet 配置

第一个ControlNet 上传包含全脸的图片,用于提取脸部信息instantid模型发布,stable diffusion,人工智能,AI作画,AI技术,AIGC其中:

  • 预处理器:instant_id_face_embedding

  • 模型:ip-adapter_instant_id_sdxl

  • 控制权重:(0.2-1)之间,越大,出图效果比较模糊,越小图片和原图的脸部就越不像

第二个ControlNet上传姿势图片,用于提取姿势信息注意:姿势图片可以和第一个ControlNet 不需要是同一个人instantid模型发布,stable diffusion,人工智能,AI作画,AI技术,AIGC其中:

  • 预处理器:instant_id_face_keypoints

  • 模型:control_instant_id_sdxl

  • 控制权重:(0.5-1)之间,越大,出图效果比较模糊,越小图片和原图的脸部就越不像

配置完后直接出图,看看效果,效果还是非常不错的instantid模型发布,stable diffusion,人工智能,AI作画,AI技术,AIGC

在换一个提示词,其它不变

提示词  
1girl,sweater,white background  

instantid模型发布,stable diffusion,人工智能,AI作画,AI技术,AIGC

再换一个姿势背景,其它的不变instantid模型发布,stable diffusion,人工智能,AI作画,AI技术,AIGC

出图效果instantid模型发布,stable diffusion,人工智能,AI作画,AI技术,AIGC

由于我只使用了 DreamShaperXL 来出图,所以出图的风格比较单一,你可以可以使用任意类型的模型和姿势来出图,效果都杠杠的~

快快试玩起来~

这个是自研的AI工具集合小程序哦,免费试用

写在最后

感兴趣的小伙伴,赠送全套AIGC学习资料,包含AI绘画、AI人工智能等前沿科技教程和软件工具,具体看这里。

instantid模型发布,stable diffusion,人工智能,AI作画,AI技术,AIGC

AIGC技术的未来发展前景广阔,随着人工智能技术的不断发展,AIGC技术也将不断提高。未来,AIGC技术将在游戏和计算领域得到更广泛的应用,使游戏和计算系统具有更高效、更智能、更灵活的特性。同时,AIGC技术也将与人工智能技术紧密结合,在更多的领域得到广泛应用,对程序员来说影响至关重要。未来,AIGC技术将继续得到提高,同时也将与人工智能技术紧密结合,在更多的领域得到广泛应用。

instantid模型发布,stable diffusion,人工智能,AI作画,AI技术,AIGC

一、AIGC所有方向的学习路线

AIGC所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证自己学得较为全面。

instantid模型发布,stable diffusion,人工智能,AI作画,AI技术,AIGC

instantid模型发布,stable diffusion,人工智能,AI作画,AI技术,AIGC

二、AIGC必备工具

工具都帮大家整理好了,安装就可直接上手!
instantid模型发布,stable diffusion,人工智能,AI作画,AI技术,AIGC

三、最新AIGC学习笔记

当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。
instantid模型发布,stable diffusion,人工智能,AI作画,AI技术,AIGC
instantid模型发布,stable diffusion,人工智能,AI作画,AI技术,AIGC

四、AIGC视频教程合集

观看全面零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。

instantid模型发布,stable diffusion,人工智能,AI作画,AI技术,AIGC

五、实战案例

纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
instantid模型发布,stable diffusion,人工智能,AI作画,AI技术,AIGC文章来源地址https://www.toymoban.com/news/detail-830243.html

instantid模型发布,stable diffusion,人工智能,AI作画,AI技术,AIGC 若有侵权,请联系删除

到了这里,关于Stable Diffusion InstantID 炸裂!只需要一张图就可以换脸 | 详细教程的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 财务思维一张图

    系统研读了《肖星的财务思维课》和得到《贾宁·财务思维课》,尝试用一张最简单的图总结财务思维所学到精髓吧。 《肖星的财务思维课》 得到《贾宁·财务思维课》 附: 【清华大学】最好的财务课《商业的财务逻辑》(全7课)肖星教授 【清华大学】最好的财务课《商业

    2024年01月19日
    浏览(55)
  • 一张图学会python递归函数

    递归函数属于那种“难者不会,会者不难”的事情,回想自己大学时学习递归函数的经历,简直是痛不欲生,代码里没有一行是看不懂的,但就是理解不了它是怎样运行的。 等到自己悟通了原理,就又会觉得这东西太简单了,不明白自己当初为何想不清楚。 对于递归函数,

    2023年04月09日
    浏览(38)
  • 【Linux】一张图了解系统文件

    首先先认识磁盘结构 系统文件分布图 文件查找 文件删除 文件的增删改查都是围绕 inode 来完成的,所以当我们要进行文件删除的时候,只需要通过 inode 来获取到它对应的 block bitmap 和 inode bitmap 数据块容器和保存文件属性的位置置为 0即可 ,如果想要恢复,通过一定的方法设

    2024年02月11日
    浏览(49)
  • 一张图搞懂微服务架构设计

    当前,微服务架构在很多公司都已经落地实施了,下面用一张图简要概述下微服务架构设计中常用组件。不能说已经使用微服务好几年了,结果对微服务架构没有一个整体的认知,一个只懂搬砖的程序员不是一个好码农! 在上图中可以看到,Nginx作为整个架构的流量入口,可以

    2023年04月17日
    浏览(52)
  • uniapp:手写签名,多张图合成一张图

    要实现的内容 :手写签名,协议内容。点击提交后:生成1张图片,有协议内容和签署日期和签署人。 实现的效果图如下: 1、签名页面

    2024年02月15日
    浏览(89)
  • GLES学习笔记---立方体贴图(一张图)

    立方体贴图 如上图是一张2D纹理,我们需要将这个2D纹理贴到立方体上,立方体有6个面,所以上面的2D图分成了6个面,共有14个纹理坐标 上边的立方体一共8个顶点坐标,范围是[-1, 1]; 我们要做的是将纹理图贴到这6个面上面 我们绘制的时候使用了VBO、VAO、EBO、 indices里面是绘

    2024年01月19日
    浏览(53)
  • 一张图快速了解 Istio 的 EnvoyFilter

    EnvoyFilter 提供了一种机制来定制 Istio Pilot 生成的 Envoy 配置。使用 EnvoyFilter 修改某些字段的值,添加特定的过滤器,甚至添加全新的侦听器、集群等等。 这个功能必须谨慎使用,因为不正确的配置可能会破坏整个网格的稳定性。与其他 Istio 网络对象不同,EnvoyFilter 是叠加应

    2024年02月08日
    浏览(49)
  • 一张图读懂TuGraph Analytics开源技术架构

    TuGraph Analytics(内部项目名GeaFlow) 是蚂蚁集团开源的分布式实时图计算引擎,即流式图计算。通过SQL+GQL融合分析语言对表模型和图模型进行统一处理,实现了流、批、图一体化计算,并支持了Exactly Once语义、高可用以及一站式图研发平台等生产化能力。 开源项目代码目前托

    2024年02月12日
    浏览(49)
  • 网络安全——一张图看懂HTTPS建立过程

    · 准备工作(对应图中prepare1234) · 发起链接 · 最后 关于网络安全加密的介绍可以看之前文章: (数据的加密与签名) HTTPS建立过程相当复杂,下图为示意图,可以有整体认识,一般我们编程知道这些已足够。 如果你想仿照HTTPS实现类似加密,可以阅读下具体过程,作为参

    2024年04月12日
    浏览(45)
  • Stable Diffusion WebUI 集成 LoRA模型,给自己做一张壁纸 Ubuntu22.04 rtx2060 6G

    LoRA的全称是LoRA: Low-Rank Adaptation of Large Language Models,可以理解为stable diffusion(SD)模型的一种插件,和hyper-network,controlNet一样,都是在不修改SD模型的前提下,利用少量数据训练出一种画风/IP/人物,实现定制化需求,所需的训练资源比训练SD模要小很多,非常适合社区使用者

    2024年02月12日
    浏览(47)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包