开源项目 | 用AI给人像照片换发型和发色(附详细步骤 + 避坑指南)

这篇具有很好参考价值的文章主要介绍了开源项目 | 用AI给人像照片换发型和发色(附详细步骤 + 避坑指南)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

导  读

    本文主要介绍使用开源项目Barbershop给人像照片换发型和发色(附详细步骤 + 避坑指南)。

背景介绍

ai 发型迁移,深度学习,图像处理相关,OpenCV,人工智能,计算机视觉,图像处理,GAN,OpenCV,Python

    摘要:由于光照、几何和部分遮挡的复杂关系会导致图像不同部分之间的耦合,因此无缝混合多个图像的特征极具挑战性。尽管最近关于 GAN 的研究能够合成真实的头发或面部,但仍然很难将它们组合成单个、连贯且合理的图像,而不是一组不连贯的图像块。我们提出了一种基于 GAN 反转的图像混合新颖解决方案,特别是针对发型转移问题。我们提出了一种新的图像混合潜在空间,它能够更好地保留细节和编码空间信息,并提出一种新的 GAN 嵌入算法,它能够稍微修改图像以符合常见的分割掩码。我们新颖的表示方法能够从多个参考图像中传输视觉属性,包括痣和皱纹等特定细节,并且因为我们在潜在空间中进行图像混合,所以我们能够合成连贯的图像。我们的方法避免了其他方法中存在的混合伪影,并找到全局一致的图像。我们的结果表明,用户研究中的当前技术水平有了显著改进,95% 以上的用户更喜欢我们的混合解决方案。

    开源项目名为Barbershop,可以将一张照片中人的发型和发色换成参考照片的发型和发色,效果较为逼真。

    项目github地址:

https://github.com/ZPdesu/Barbershop

    论文地址:

https://zpdesu.github.io/Barbershop/Barbershop.pdf

ai 发型迁移,深度学习,图像处理相关,OpenCV,人工智能,计算机视觉,图像处理,GAN,OpenCV,Python

 

部署与使用步骤

    【1】本地部署。可以参考下面链接:

https://huyi-aliang.blog.csdn.net/article/details/122268313?ydreferer=aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl8zOTM4MTkzNy9hcnRpY2xlL2RldGFpbHMvMTMyMjgyMDc3

    【2】使用Google Colab部署。

    如何使用Colab白嫖GPU算力,大家可以参考以前的文章或者自行百度。

    Google Colab免费使用的GPU加速训练测试

https://colab.research.google.com/#scrollTo=VWAazzVrQjmG

ai 发型迁移,深度学习,图像处理相关,OpenCV,人工智能,计算机视觉,图像处理,GAN,OpenCV,Python

    ① 设置环境,选择GPU和Python版本:

ai 发型迁移,深度学习,图像处理相关,OpenCV,人工智能,计算机视觉,图像处理,GAN,OpenCV,Python

    ② 下载源码:

!git clone https://github.com/ZPdesu/Barbershop.git

ai 发型迁移,深度学习,图像处理相关,OpenCV,人工智能,计算机视觉,图像处理,GAN,OpenCV,Python

   ③ 进入根目录:

%cd Barbershop

ai 发型迁移,深度学习,图像处理相关,OpenCV,人工智能,计算机视觉,图像处理,GAN,OpenCV,Python

   ④ 安装依赖项:

    源码中是用yaml直接创建环境,environment/environment.yaml ,这里我们需要将environment.yaml文件中需要pip的包复制出来,粘贴进新建的一个requirements.txt中,这里我已经在本地电脑建好,直接上传到Barbershop根目录。requirements.txt内容如下:

beautifulsoup4==4.10.0cachetools==4.2.4charset-normalizer==2.0.7click==8.0.3clip==0.1.0deprecated==1.2.13dlib==19.22.1et-xmlfile==1.1.0filelock==3.4.0ftfy==6.0.3gdown==4.2.0google-api-core==1.31.4google-api-python-client==2.7.0google-auth==1.35.0google-auth-httplib2==0.1.0googleapis-common-protos==1.54.0httplib2==0.19.1huggingface-hub==0.1.2idna==3.3joblib==1.1.0oauth2client==4.1.3opencv-python==4.5.4.58openpyxl==3.0.7protobuf==3.19.1pyasn1==0.4.8pyasn1-modules==0.2.8pyqt5==5.13.0pyqt5-qt5==5.15.2pyqt5-sip==12.9.0pysocks==1.7.1python-magic==0.4.24pytorch-fid==0.2.1pytorch-msssim==0.2.1pytz==2021.3qdarkgraystyle==1.0.2qdarkstyle==3.0.2regex==2021.11.2requests==2.26.0rsa==4.8sacremoses==0.0.46scikit-learn==1.4.0soupsieve==2.3.1threadpoolctl==3.0.0tokenizers==0.10.3torchdiffeq==0.2.2tqdm==4.62.3transformers==4.12.3uritemplate==3.0.1urllib3==1.26.7wrapt==1.13.3ninja==1.11.1.1
!pip install -r requirements.txt

ai 发型迁移,深度学习,图像处理相关,OpenCV,人工智能,计算机视觉,图像处理,GAN,OpenCV,Python

    大约需要10分钟左右安装完成,如果遇到个别包版本冲突或异常可使用清华的镜像安装:

!pip install Ninja -i https://pypi.tuna.tsinghua.edu.cn/simple

   ⑤ 人脸预处理:

!python align_face.py

ai 发型迁移,深度学习,图像处理相关,OpenCV,人工智能,计算机视觉,图像处理,GAN,OpenCV,Python

   ⑥ 进行推理:

# 运行可能提示ffhq.pt缺失,可以下载下来放到pretrained_models中即可# !git clone https://drive.google.com/uc?id=1AT6bNR2ppK8f2ETL_evT27f3R_oyWNHS

#(有点耗时GPU跑10-20分钟)!python main.py --im_path1 90.png --im_path2 15.png --im_path3 117.png --sign realistic --smooth 5

    输入图像90.png:

ai 发型迁移,深度学习,图像处理相关,OpenCV,人工智能,计算机视觉,图像处理,GAN,OpenCV,Python

    发型参考图像15.png:

ai 发型迁移,深度学习,图像处理相关,OpenCV,人工智能,计算机视觉,图像处理,GAN,OpenCV,Python

    发色参考图像117.png:

ai 发型迁移,深度学习,图像处理相关,OpenCV,人工智能,计算机视觉,图像处理,GAN,OpenCV,Python

    处理后生成的mask图:

ai 发型迁移,深度学习,图像处理相关,OpenCV,人工智能,计算机视觉,图像处理,GAN,OpenCV,Python

    处理后生成的结果图:

ai 发型迁移,深度学习,图像处理相关,OpenCV,人工智能,计算机视觉,图像处理,GAN,OpenCV,Python

耗时18分钟

ai 发型迁移,深度学习,图像处理相关,OpenCV,人工智能,计算机视觉,图像处理,GAN,OpenCV,Python

    尝试下其他图片的效果(左1输入,中间参考,右1输出):

ai 发型迁移,深度学习,图像处理相关,OpenCV,人工智能,计算机视觉,图像处理,GAN,OpenCV,Python

ai 发型迁移,深度学习,图像处理相关,OpenCV,人工智能,计算机视觉,图像处理,GAN,OpenCV,Python

ai 发型迁移,深度学习,图像处理相关,OpenCV,人工智能,计算机视觉,图像处理,GAN,OpenCV,Python

可能遇到的报错:unexpected EOF, expected 455433 more bytes. The file might be corrupted.

解决方法:删除ffhq.pt重新上传,注意大小大约126M文章来源地址https://www.toymoban.com/news/detail-833226.html

到了这里,关于开源项目 | 用AI给人像照片换发型和发色(附详细步骤 + 避坑指南)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 最新版本 Stable Diffusion 开源 AI 绘画工具之 老照片高清修复 篇

    在 AI 绘画出来后,飞兔小哥就一直思考它的商业出路,其中之一应用我觉得就是老照片修复 其实在 stable diffusion 中修复老照片,其实有很好的效果,根据目前其内置的功能,大概有三种可用的高清修复功能 而飞兔小哥也在社区开了相应的 AI 专栏,并将自己平时生成和修复处

    2024年02月09日
    浏览(70)
  • 3张照片打造专属形象!酷蛙FaceChain解密个人写真开源项目,人人AIGC!

    各类AI写真软件由于其精准的个人形象+精美的生成效果引爆了朋友圈传播,证件照满足了用户刚需,古装照等风格照满足了用户“美照”的需求。 酷蛙FaceChain开源项目团队推出了开源版本,希望结合开源社区开发者的力量,可以让图片应用更有趣、更好玩、也有更多应用场景

    2024年02月12日
    浏览(40)
  • 【计算机视觉|风格迁移】PP-GAN:使用GAN的地标提取器将韩国人像的风格转化为身份证照片

    本系列博文为深度学习/计算机视觉论文笔记,转载请注明出处 标题: PP-GAN : Style Transfer from Korean Portraits to ID Photos Using Landmark Extractor with GAN 链接:[2306.13418] PP-GAN : Style Transfer from Korean Portraits to ID Photos Using Landmark Extractor with GAN (arxiv.org) 风格转换的目标是在保持图像内容的同

    2024年02月13日
    浏览(42)
  • AI绘画人像promt分享

    Promt Checkpoint为基础模型,常用chilloutmix和majicmixRealistic 在设置好checkpoint后,即可设置promt,按照经验来说, promt=Base promt+Description promt+lora+positive Texture+Style promt 其中的positive Texture和lora根据需求可以从c站下载,根据顺序输入出的图会比较契合需求,CFG通常设置为7~8。Sampling m

    2024年02月09日
    浏览(46)
  • AI绘画与虚拟人生成实践(一):生成人像,AI绘画模型和工具的效果对比

    本篇的目的是生成一个虚拟的女生形象。先进入正题说明人像怎么生成,本篇使用到的工具和工具的介绍放在文末。 先来一波Midjourney生成的美图提升下大家学习的欲望 以上四张图使用的是相同的Prompt,如下: a beautiful chinese girl, 18 years old, detailed and big eyes, white and soft skin,

    2024年02月09日
    浏览(47)
  • AI > 语音识别开源项目列举

    名称 所属开发机构 使用场景 优缺点 技术特点 占有率 描述 CMU Sphinx 卡内基梅隆大学 嵌入式设备、服务器应用 优点:可用于嵌入式设备和服务器应用。 缺点:准确率相对较低,适用范围有限。 - 支持多种语言模型和工具。- 适用于嵌入式设备和服务器应用。 中等 CMU Sphinx 是

    2024年02月15日
    浏览(82)
  • 一个悄然崛起的AI开源项目!

    众所周知,最近这半年AI相关的话题实在是火到出圈。尤其是 生成式AI 的流行,让我们普通人也可以近距离地接触和应用AI。这其中最典型的就是ChatGPT。 那除了ChatGPT,还有一个非常实用的领域,也是我们今天要讨论的话题,那就是图像生成领域的 AI绘画 。利用这个技术,我

    2024年02月09日
    浏览(43)
  • 这 4 个 AI 项目开源了!

    今日推荐开源项目目录: 1. 基于 AI 的口语训练平台 2. 一句话生成 3D 模型 3. 歌声转换 4. 识图模型 基于 AI 的口语训练平台 Polyglot 是一个开源的基于 AI 的口语训练平台客户端,可以在 Windows、Mac 上使用。 比如你想练习英语口语,只需在该平台配置一个虚拟的 AI 国外好友,你

    2024年02月09日
    浏览(29)
  • 【开放视觉】AI人像特效之「更快、更高、更强的互娱换脸解决方案」

           最新 FaceChain支持多人合照写真功能,项目信息汇总:ModelScope 魔搭社区        github开源直达(觉得有趣的点个star哈。):https://github.com/modelscope/facechain 正文: 原作者:姚远(嘉弈),清遥 简介: 换脸技术旨在将图像或者视频中的人脸替换成目标人脸,使生成

    2024年02月08日
    浏览(33)
  • 智能AI知识库,增强AI知识的开源项目

    FastWiki是一个高性能、基于最新技术栈的知识库系统,旨在为大规模信息检索和智能搜索提供解决方案。它采用微软Semantic Kernel进行深度学习和自然语言处理,在后端使用 MasaFramework ,前端采用 MasaBlazor 框架,实现了一个高效、易用、可扩展的智能向量搜索平台。其目标是帮

    2024年03月09日
    浏览(57)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包