3张照片打造专属形象!酷蛙FaceChain解密个人写真开源项目,人人AIGC!

这篇具有很好参考价值的文章主要介绍了3张照片打造专属形象!酷蛙FaceChain解密个人写真开源项目,人人AIGC!。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

一、背景说明

各类AI写真软件由于其精准的个人形象+精美的生成效果引爆了朋友圈传播,证件照满足了用户刚需,古装照等风格照满足了用户“美照”的需求。

酷蛙FaceChain开源项目团队推出了开源版本,希望结合开源社区开发者的力量,可以让图片应用更有趣、更好玩、也有更多应用场景。该开源项目短短几天内,star数已经突破500。欢迎大家点击链接(能按照到本地体验,如果觉得好的可以点个star,你们的鼓励是我们最大的动力,我们将不断推陈出新,扩展应用):https://github.com/modelscope/facechain。在线体验,魔搭社区创空间体验环境:人物写真生成。

二、效果展示

商务证件照生成案例如下(已经过授权~)

3张照片打造专属形象!酷蛙FaceChain解密个人写真开源项目,人人AIGC!,深度 学习论文与相关应用,AIGC

3张照片打造专属形象!酷蛙FaceChain解密个人写真开源项目,人人AIGC!,深度 学习论文与相关应用,AIGC

输入:

3张照片打造专属形象!酷蛙FaceChain解密个人写真开源项目,人人AIGC!,深度 学习论文与相关应用,AIGC

输出:

3张照片打造专属形象!酷蛙FaceChain解密个人写真开源项目,人人AIGC!,深度 学习论文与相关应用,AIGC

三、原理讲解(重点来了!)

这一部分我们为大家揭秘个人写真模型的核心技术点。

3张照片打造专属形象!酷蛙FaceChain解密个人写真开源项目,人人AIGC!,深度 学习论文与相关应用,AIGC

个人写真模型流程图

1、基本原理:

个人写真模型的能力来源于Stable Diffusion模型的文生图功能,输入一段文本或一系列提示词,输出对应的图像。我们考虑影响个人写真生成效果的主要因素:写真风格信息,以及用户人物信息。为此,我们分别使用线下训练的风格LoRA模型和线上训练的人脸LoRA模型以学习上述信息。LoRA是一种具有较少可训练参数的微调模型,在Stable Diffusion中,可以通过对少量输入图像进行文生图训练的方式将输入图像的信息注入到LoRA模型中。因此,个人写真模型的能力分为训练与推断两个阶段,训练阶段生成用于微调Stable Diffusion模型的图像与文本标签数据,得到人脸LoRA模型;推断阶段基于人脸LoRA模型和风格LoRA模型生成个人写真图像。

2、训练阶段:

输入:用户上传的包含清晰人脸区域的图像

输出:人脸LoRA模型

描述:首先,我们分别使用基于朝向判断的图像旋转模型,以及基于人脸检测和关键点模型的人脸精细化旋转方法处理用户上传图像,得到包含正向人脸的图像;接下来,我们使用人体解析模型和人像美肤模型,以获得高质量的人脸训练图像;随后,我们使用人脸属性模型和文本标注模型,结合标签后处理方法,产生训练图像的精细化标签;最后,我们使用上述图像和标签数据微调Stable Diffusion模型得到人脸LoRA模型。

3、推断阶段:

输入:训练阶段用户上传图像,预设的用于生成个人写真的输入提示词

输出:个人写真图像

描述:首先,我们将人脸LoRA模型和风格LoRA模型的权重融合到Stable Diffusion模型中;接下来,我们使用Stable Diffusion模型的文生图功能,基于预设的输入提示词初步生成个人写真图像;随后,我们使用人脸融合模型进一步改善上述写真图像的人脸细节,其中用于融合的模板人脸通过人脸质量评估模型在训练图像中挑选;最后,我们使用人脸识别模型计算生成的写真图像与模板人脸的相似度,以此对写真图像进行排序,并输出排名靠前的个人写真图像作为最终输出结果。

附(流程图中模型链接):

[1]  人脸检测+关键点模型DamoFD:https://modelscope.cn/models/damo/cv_ddsar_face-detection_iclr23-damof

[2]  图像旋转模型:创空间内置模型

[3]  人体解析模型M2FP:M2FP多人人体解析

[4]  人像美肤模型ABPN:ABPN人像美肤

[5]  人脸属性模型FairFace:人脸属性识别模型FairFace

[6]  文本标注模型Deepbooru:https://github.com/KichangKim/DeepDanbooru

[7]  模板脸筛选模型FQA:人脸质量模型FQA

[8]  人脸融合模型:图像人脸融合

[9]  人脸识别模型RTS:人脸识别OOD模型

四、直播回放

搜索揭秘酷蛙FaceChain开源项目:3张照片打造AI个人写真

【联播渠道】

  • 魔搭ModelScope社区视频号

  • 阿里云视频号

  • 阿里达摩院扫地僧视频号

五、开源招募

酷蛙FaceChain项目已开源,我们计划后续联合开源社区的力量不断打磨该开源项目,解锁更多高阶玩法,进行更深层次的算法创新,并发表相应顶会论文。如果你对该开源项目感兴趣,对该开源项目的未来有憧憬与信仰,想一起搞点事情,欢迎扫码加入:

初步需要打磨的模块如下:

1.)更多写真风格lora模型训练

2.)自适应基模+多lora融合模块探索

3.)专业的face prompt模型训练

4.)专业的SD人物写真基模训练

5.)人物属性的更多prompt探索

6.)swap face模块的打磨优化

7.)女性专业美颜后处理模块探索

8.)高阶应用探索:(例如:表情包、人物动态视频、游戏角色设计、影视动画角色设计等)文章来源地址https://www.toymoban.com/news/detail-652355.html

到了这里,关于3张照片打造专属形象!酷蛙FaceChain解密个人写真开源项目,人人AIGC!的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 玩转DIY可视化打造专属小程序

    DIYGW可视化工具是一个傻瓜式、拖拽式、模块化开发软件工具;一个从想法到原型到源码,一步到位低代码生成源码工具。 所见即所得,拖拽设计,无编程基础的人都能轻松掌握。只需一次设计,就能拥有微信小程序、支付宝小程序、头条小程序、QQ小程序、百度小程序、F

    2023年04月22日
    浏览(47)
  • stable diffusion打造自己专属的LORA模型

    通过Lora小模型可以控制很多特定场景的内容生成。 但是那些模型是别人训练好的,你肯定很好奇,我也想训练一个自己的专属模型(也叫炼丹~_~)。 甚至可以训练一个专属家庭版的模型(family model),非常有意思。 将自己的训练好的Lora模型放到stableDiffusion lora 目录中,

    2023年04月09日
    浏览(76)
  • 无线WiFi安全渗透与攻防(二)之打造专属字典

    系列文章 无线WiFi安全渗透与攻防(一)之无线安全环境搭建 什么在破解之前先准备专用字典,因为对于一般家庭来说,常用 一个是预共享密钥PSK,一个是PIN码。 也不是所有的路由都开起了PIN码,一般都会开启域共享密钥。 1.概念 (1).预共享密钥模式 预共享密钥模式(pre-

    2024年02月13日
    浏览(34)
  • 只需四步,手把手教你打造专属数字人

    伴随ChatGPT的问世,在技术与商业运作上都日渐发展成熟的数字人产业正持续升温。去年9月,北京市发布了国内首个数字人产业专项支持政策,提出将依托国家文化专网将数字人纳入文化数据服务平台。以数字人、ChatGPT为代表的互联网3.0创新应用产业机遇正迎面而来,美摄数

    2024年02月08日
    浏览(51)
  • 利用GPTs,打造你的专属AI聊天机器人

    在2023年11月的「OpenAI Devday」大会上,OpenAI再度带来了一系列令人瞩目的新功能,其中ChatGPT方面的突破尤为引人关注。而GPTs的亮相,不仅标志着个性化AI时代的到来,更为开发者和普通用户提供了前所未有的便利。接下来,我们一起深入了解GPTs是什么,能帮助我们做什么。

    2024年04月08日
    浏览(59)
  • 教育课堂小程序,三分钟打造专属小程序 带完整搭建教程

    大家好哇,今天来给大家分享一款教育课堂小程序。现如今,线上教育已经普及,在大学课堂里,老师尝尝是使用各种各样的学习APP进行点名,签到,答题,考试等等,相较于传统的APP来说,小程序不需要下载安装,几乎不占手机内存,也不会影响手机运行速度,即用即走。

    2024年02月07日
    浏览(27)
  • 只需三步,本地打造自己的AI个人专属知识库

    本文会手把手教你如何部署本地大模型以及搭建个人知识库,使用到的工具和软件有 Ollama Open WebUI Docker AnythingLLM 本文主要分享三点 如何用Ollama在本地运行大模型 使用现代Web UI和本地大模型\\\"聊天\\\" 如何打造完全本地化的知识库:Local RAG 读完本文,你会学习到 如何使用最好用

    2024年04月27日
    浏览(34)
  • 为医生打造专属数字分身!华为云联合万木健康打造医疗医学科普和患者教育数字人引擎

    摘要: 如今,医生出镜的视频已经成为喜闻乐见的医学科普和患者教育手段,但医生难以抽出时间拍摄、拍摄时间较长、成本较高等制作痛点也日益凸显。对此,国内首个医生AI数字人运营服务商——成都万木健康科技有限公司找到了破局之法。 本文分享自华为云社区《为医

    2024年02月10日
    浏览(54)
  • 火山引擎DataTester上线「集成工作台」功能,助力企业打造专属AB平台

    更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群   AB测试不仅是做增长的“利器”,也是企业优化效率、增加决策精确度的有效工具。随着国内企业服务市场需求的多元,企业对AB测试平台的“个性化”要求也更高。在此背景下,

    2024年02月05日
    浏览(41)
  • 基于Docker搭建NextCloud-打造个人专属或团队共享的私有同步网盘

    几年前还百家争锋的国内网盘市场,如今只剩下百度网盘一枝独秀,但是100kb/s限速让人寒心。虽然还有一些稳定的国外网盘,如 OneDrive、DropBox、Google Drive 等,但国内访问并不友好。 Nextcloud 是一个免费专业的私有云存储网盘「开源」项目,可以让你简单快速地在个人/公司电

    2024年02月04日
    浏览(41)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包