AIGC内容分享(十八):AIGC在天猫商品海报生成上的探索

这篇具有很好参考价值的文章主要介绍了AIGC内容分享(十八):AIGC在天猫商品海报生成上的探索。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

目录

项目背景

目标拆解

方案调研

▐  方案一 SD + Outpainting​​​​​​​

▐  方案二 SD Inpainting + Reference Only

▐  方案三 基于Reference的Diffusion算法

▐  方案四 SD + Lora/Dreambooth

优化方向

▐  探索一 VAE增强

▐  探索二 图像超分

▐  探索三  贴图

线上方案

测试效果

线上效果

下一步探索方向

引用


项目背景

灵感艺术家项目,旨在通过AIGC绘图能力,联合商家打造低门槛+高趣味性的宣传海报设计大赛,为新品进行宣传和造势。同时也是为了给消费者提供参与新品宣发的通道。

sd xl给一个产品图生成类似的产品,AI(人工智能) 内容分享,AIGC 内容分享,AIGC

目标拆解

GPT部分采用通义千问大语言模型,详见其技术文档。本文重点介绍海报风格的图像生成部分,分为商品海报、皮克斯,二次元,写实四种风格:

sd xl给一个产品图生成类似的产品,AI(人工智能) 内容分享,AIGC 内容分享,AIGC

sd xl给一个产品图生成类似的产品,AI(人工智能) 内容分享,AIGC 内容分享,AIGC

sd xl给一个产品图生成类似的产品,AI(人工智能) 内容分享,AIGC 内容分享,AIGC

sd xl给一个产品图生成类似的产品,AI(人工智能) 内容分享,AIGC 内容分享,AIGC

皮克斯、二次元、写实三个风格,实现思路比较清晰,属于标准的文生图,基于MJ、SD都可以实现。分析MJ和SD的优缺点的文章有很多,不做赘述,我们最终选择SD作为文生图的算法方案,核心在于SD开源,可塑性强。基于diffusers,我们重写了一套SD实现,支持VAE、ControlNet、Lora、Embedings等功能,根据业务特点,定制了warmup、auto_predict等能力。比较轻松的解决了这三个风格的生成问题。

算法的难点在于商品海报的风格生成,品牌方要求商品高度还原,并且生成的海报,像素清晰、细节丰富、具备高级感。要求是丰满的,而现实是骨感的。商品细节复杂,特别是带有文字时,很难生成。并且绘图灵感由用户文字随机输入,出图效果几乎是不可控的。为此,我们进行了大量调研,并做了一些优化尝试。

方案调研

以香奈儿5号香水为例,初步尝试了4套方案。

▐  方案一 SD + Outpainting

简述:固定商品位置,重绘商品之外的区域。

优点:不会影响香水的外观。

缺点:图片中人物、背景与香水的位置关系很难控制,有比较明显的违和感。

sd xl给一个产品图生成类似的产品,AI(人工智能) 内容分享,AIGC 内容分享,AIGC

▐  方案二 SD Inpainting + Reference Only

简述:以商品图信息注入attention层中,来控制unet生成相似的图像。

优点:可以完全保留预生成的背景。

缺点:香水还原度低。

sd xl给一个产品图生成类似的产品,AI(人工智能) 内容分享,AIGC 内容分享,AIGC

▐  方案三 基于Reference的Diffusion算法

简述:基于一张参考商品图,生成较相似的商品

代表:PBE, IP Adapter, Anydoor…

优点:泛化性强,无需对每个商品单独训练

缺点:商品细节依旧不够还原copy&paste过于严重

sd xl给一个产品图生成类似的产品,AI(人工智能) 内容分享,AIGC 内容分享,AIGC

sd xl给一个产品图生成类似的产品,AI(人工智能) 内容分享,AIGC 内容分享,AIGC

sd xl给一个产品图生成类似的产品,AI(人工智能) 内容分享,AIGC 内容分享,AIGC

▐  方案四 SD + Lora/Dreambooth

简述:微调模型,注入商品外貌信息

优点:商品外貌还原度较高,且出图率较稳定

缺点:文字等细节还原度仍然不够高;且细节部分越小,其扭曲失真程度就越严重

sd xl给一个产品图生成类似的产品,AI(人工智能) 内容分享,AIGC 内容分享,AIGC

方案四最接近想要的效果,但距离我们的要求,还有很大的差距。

优化方向

  探索一 VAE增强

对LDM(SD的主要引用论文)模型的结构进行分析,初步怀疑细节还原不足的核心原因在于VAE从像素空间到隐空间相互转换过程中,丢失了细节信息。

sd xl给一个产品图生成类似的产品,AI(人工智能) 内容分享,AIGC 内容分享,AIGC

为了验证猜想,我们做了一个测试,对一张图片进行十次encoder和decoder操作,文字等图像细节已经开始模糊。我们想了一个方法,对VAE丢失的信息进行补偿,还原度有比较可观的增强。

sd xl给一个产品图生成类似的产品,AI(人工智能) 内容分享,AIGC 内容分享,AIGC

但距离完美还原,依然还有差距。

  探索二 图像超分

既然细节难以还原,那么把细节放大,是否还原度就可以提升?为了验证这个猜想,我们做了如下的实验。
在256 * 256分辨率下,文字几乎无法辨认。

sd xl给一个产品图生成类似的产品,AI(人工智能) 内容分享,AIGC 内容分享,AIGC

在512  512分辨率下,相对256  256有明显改善,而且 2.X版本的还原度优于1.X版本。

sd xl给一个产品图生成类似的产品,AI(人工智能) 内容分享,AIGC 内容分享,AIGC

升级到SDXL后,文字还原度进一步增强。

sd xl给一个产品图生成类似的产品,AI(人工智能) 内容分享,AIGC 内容分享,AIGC

像素提升,还原度确实有提升。很自然的,我们想到可以在生成的图像上,对文字等细节部分进行超分,然后在refiner阶段,训练专属的 controlnet,进一步提升还原度。

sd xl给一个产品图生成类似的产品,AI(人工智能) 内容分享,AIGC 内容分享,AIGC

经过多次调整,细节还原度能达到90%以上。但距离完美还原,依然还有一点差距。

  探索三  贴图

既然文字等细节非常难还原,那么是否可以直接把文字部分复制粘贴回去?

sd xl给一个产品图生成类似的产品,AI(人工智能) 内容分享,AIGC 内容分享,AIGC


通过提取原始商品的文字区域,贴图到生成商品的对应区域,完美还原文字细节。

线上方案

经过上述几个方向的探索,初步解决了香水等商品的海报生成问题,但对复杂图文的商品依然很难还原,例如:

sd xl给一个产品图生成类似的产品,AI(人工智能) 内容分享,AIGC 内容分享,AIGC

既要完美还原,又要增加泛化性,索性,全图贴回去【狗头】。方案如下:

sd xl给一个产品图生成类似的产品,AI(人工智能) 内容分享,AIGC 内容分享,AIGC

  1. 离线模块通过文生图产生一个背景图库。

  2. 离线模块预置多角度商品图,解决商品角度的多样性问题。

  3. 从背景图库中选择一张跟当前商品最相关的图作为引导图。解决商品和背景不协调的问题,提高出图率。

  4. 由商品图和背景图一起,生成线框图和商品白底图以及对应的mask。

  5. 通过Stable Diffusion+Canny Controlnet+Reference生成初步的商品海报。

  6. 使用SAM和LAMA抹除商品,防止后面贴图时,边缘出现对不齐的情况。

  7. 将抹去商品的图和步骤4中的商品白底图、对应的mask作为输入,合成新的图像。

  8. 提取步骤5中的生成商品的光影信息,投射到步骤7的商品上,生成最终的商品海报。

总结一下

  1. 通过Copy&Paste的方式,保证无差别还原。

  2. 通过预置引导图解决了完全随机性,提高了出图率。

  3. 通过两步生成解决了倒影等问题。图像精美,具备高级感。

  4. 通过擦除重建以及图像融合技术,缓解了商品边缘的毛刺问题。

  5. 通过从生成图上提取光影,映射到贴图,解决了光影不和谐的问题。

测试效果

sd xl给一个产品图生成类似的产品,AI(人工智能) 内容分享,AIGC 内容分享,AIGC

线上效果

sd xl给一个产品图生成类似的产品,AI(人工智能) 内容分享,AIGC 内容分享,AIGC

出图率95%以上,基本每张图都能看,大部分图能抗打。A10 GPU上,单卡出图速度3-5秒。

下一步探索方向

初步看,效果可以接受了,但依然还有一些可以提升的空间,比如:

如何进一步提升复杂海报的生成效果,增加遮挡关系?

sd xl给一个产品图生成类似的产品,AI(人工智能) 内容分享,AIGC 内容分享,AIGC

如何解决商品与背景的比例和谐,GLIGEN可能是答案?

sd xl给一个产品图生成类似的产品,AI(人工智能) 内容分享,AIGC 内容分享,AIGC

贴图总显得不那么算法,是否有机会继续提升VAE的能力,或者去掉VAE。Consistency Decoder可以试试?

sd xl给一个产品图生成类似的产品,AI(人工智能) 内容分享,AIGC 内容分享,AIGC

最后,探索从未停止,AIGC永不眠。

引用

[1] IP-Adapter: Text Compatible Image Prompt Adapter for Text-to-Image Diffusion Models
[2] Paint by Example: Exemplar-based Image Editing with Diffusion Models
[3] AnyDoor: Zero-shot Object-level Image Customization
[4] High-Resolution Image Synthesis with Latent Diffusion Models
[5] SDXL: Improving Latent Diffusion Models for High-Resolution Image Synthesis
[6] GLIGEN: Open-Set Grounded Text-to-Image Generation
[7] https://github.com/openai/consistencydecoder文章来源地址https://www.toymoban.com/news/detail-790725.html

到了这里,关于AIGC内容分享(十八):AIGC在天猫商品海报生成上的探索的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • AIGC内容分享(四十):生成式人工智能(AIGC)应用进展浅析

    目录 0   引言 1   以ChatGPT为代表的AIGC发展现状 1.1  国外AIGC应用发展现状 1.2  国内AIGC应用发展现状 2   AIGC的技术架构 (1)数据层 (2)算力基础设施层 (3)算法及大模型层 (4)AIGC能力层 (5)AIGC功能层 (6)AIGC应用层 3   AIGC面临的机遇与挑战 3.1  AIGC带来的机遇 (

    2024年02月19日
    浏览(55)
  • [Java生成商品的海报图片 ]

    目录 前言:  生成商品海报图片需要处理两个问题: 依赖: 编写生成海报代码 另一个方法: 补全上面的main测试方法:      你知道的 这只是一个简单笔记...... 1)将文字和二维码合成为一张图片; 2)将图片保存到文件。 其中,com.google.zxing是一个二维码处理库,com.itextpdf是一

    2024年02月08日
    浏览(35)
  • AIGC时代,分享11款超实用AI生成内容检测工具

    前往未来百科查看全部AI内容检测工具箱 在数字内容创作的世界中,高质量的内容对至关重要。但随着创建的内容量不断增加,确保内容是原创的、高质量的非常具有挑战性。 AI 内容检测器指的是一种利用人工智能技术来自动化审核和识别不当、有害或非法内容的工具。它可

    2024年02月06日
    浏览(60)
  • 数据代码分享|R语言基于逐步多元回归模型的天猫商品流行度预测

    本文通过利用回归模型对天猫商品流行度进行了研究,确定了决定天猫商品流行度的重要因素。并讲述、论证了预测天猫商品流行度是天猫商品交易的至关重要的环节。通过对天猫商品流行度预测技术的发展和探讨,深度剖析了天猫商品流行度预测这个研究课题 ( 点击文末

    2024年02月16日
    浏览(46)
  • AIGC内容分享(二十):「AI视频生成」技术核心基础知识和模型应用

    目录 何为AI视频? 一、技术发展概况 二、代表模型及应用​​​​​​​ 三、仍存在许多技术难点 「 AI 视频」 通常指的是由人工智能(AI)技术生成或处理的视频。这可能包括使用深度学习、计算机视觉和其他相关技术来改善视频的质量、内容或生成全新的视频内容。一

    2024年01月18日
    浏览(53)
  • AIGC内容分享(五十三):AIGC|深入浅出一个完整的视频生成系统「VGen」核心基础知识

    目录 一、VGen整体架构 二、VGen核心基础内容 三、快速上手使用VGen进行视频生成 四、VGen与SVD的比较 「VGen」 是一个基于扩散模型的视频生成系统,提供以视频生成扩散模型为中心的强大代码库,具有先进的视频生成模型。VGen的整体架构主要围绕三个关键领域: 基本模型、创

    2024年01月21日
    浏览(63)
  • AI生成新春祝福海报,AIGC从“炫技”走向日常

    在ChatGPT的带动下,AIGC可以说是过去一年里最火的概念。 就在临近春节的日子里,一款名为“写作蛙”的微信小程序正在悄然流行。简单输入几句祝福语,就能自动生成图文并茂的祝福海报,包括一段应景的祝福语和一张节日氛围满满的照片,让AIGC和普通网民来了场近距离的

    2024年02月08日
    浏览(39)
  • 【AIGC】只要10秒,AI生成IP海报,解放双手!!!

    1、云端部署(配置不行的小伙伴看)+ 云端模型放置位置 2、本地部署(配置达标的小伙伴看) 3、运用SD训练IP的流程和技巧(LoRA篇) 4、运用SD稳定生成高质量IP海报 众所周知,各大厂目前都在AIGC的领域探索实践,也有非常多的外部设计师制作了大量的AIGC相关授课,很多同

    2024年02月08日
    浏览(35)
  • 前端生成分享海报的几种方法

    1,使用painter插件    适用于微信小程序及uniapp的小程序端 ①,引入插件painter    克隆地址:https://gitcode.net/mirrors/Kujiale-Mobile/Painter    下载的 painter 放到微信小程序的 components 目录下 ②在json文件中引入 \\\"usingComponents\\\": {         \\\"painter\\\":\\\"/components/painter/painter\\\" }, 注:在u

    2024年02月21日
    浏览(72)
  • 微信小程序实现生成分享海报案例

    一、引入插件painter (1)克隆地址:https://gitcode.net/mirrors/Kujiale-Mobile/Painter (2)下载的 painter 放到小程序的 components 目录下 二、页面中引入插件 (1)页面的 json 文件 (2)页面的 wxml 文件 其中 painter 插件可以获取绘制出来的图片路径, image 标签展示出来 三、绘制海报 1、

    2024年02月08日
    浏览(94)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包