【AIGC】手把手使用扩散模型从文本生成图像

这篇具有很好参考价值的文章主要介绍了【AIGC】手把手使用扩散模型从文本生成图像。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。


在这篇文章中,我们将手把手展示如何使用Hugging Face的diffusers包通过文本生成图像。

从 DALLE 到Stable Diffusion

DALLE2是收费的,用户只有一些免费的额度,如果免费额度使用完毕就需要付费了,所以必须寻找替代方案,并发现了Hugging Face,他们发布了一个扩散模型的包diffusers ,可以让我们直接使用。
【AIGC】手把手使用扩散模型从文本生成图像

使用diffusers package从文本prompt生成图像

首先,使用diffusers包从文本生成图像,我们要有一个GPU,可以使用google的colab,但是常规的colab由于RAM有限制,可能会存在中断的情况,或者也可以购买Pro版本。这里我们使用自己的GPU服务器。

然后,要安装如下package:

  • diffusers==0.2.4 — 这是我们主要使用的包
  • transformers — 这个是Hugging Face的成名基础包
  • scipy — 科学计算的
  • ftfy — 处理一些文本编码问题
  • ipywidgets>=7,<8 — notebook的一个小组件的基础包
  • torch —这个就不用说了
  • pillow — 处理图片的

安装命令:

!pip install diffusers==0.2.4
!pip install transformers scipy ftfy
!pip install "ipywidgets>=7,<8"

导入依赖包:

import torch
from diffusers import StableDiffusionPipeline

下载StableDiffusionPipeline,并使用GPU加载:

model_id = "CompVis/stable-diffusion-v1-4"
device = "cuda"


pipe = StableDiffusionPipeline.from_pretrained(model_id, torch_dtype=torch.float16)
pipe = pipe.to(device)

此时报出一个Warning:
【AIGC】手把手使用扩散模型从文本生成图像
安装accelerate:pip install accelerate

然后,使用PyTorch的autocast运行推理:
【AIGC】手把手使用扩散模型从文本生成图像
最后,查看结果:
【AIGC】手把手使用扩散模型从文本生成图像
结果非常不错。我们也可以调整一些参数,例如guide_scalestep和设置随机种子(用于确定性输出),来控制我们的模型输出,具体的更详细的使用方式请看:文章来源地址https://www.toymoban.com/news/detail-485829.html

参考资料

  1. CompVis/stable-diffusion-v1-4
  2. Stable Diffusion with 🧨 Diffusers

到了这里,关于【AIGC】手把手使用扩散模型从文本生成图像的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 手把手教你使用stable diffusion生成自己的艺术二维码

    随着AIGC的发展,CV领域也涌出了一大批优秀的工具,如md(midjourney)和sd(stable diffusion) 上手简单(只需要学一些prompt的写法和命令的使用) 需要一个discord账号 效果稳定比较容易出图 可定制性差 成本高,需要显卡(可以是云服务器) 上手难度大,需要自己配置环境,熟悉各种参数的

    2024年02月12日
    浏览(84)
  • 手把手教你使用Java生成助记词、私钥、地址|Java区块链钱包生成助记词、地址

    在spring boot 项目中的 pom.xml文件中加入需要的依赖 可见恢复的地址和我们生成地址一样。

    2024年02月11日
    浏览(38)
  • 手把手教你如何使用SpringBoot3打造一个个性化的代码生成器

    代码基于SpringBoot3、Vue3、highlight实现自定义代码生成功能 SpringBoot3.x、MySQL8、MyBatisPlus3.5.x、velocity2.x、SpringSecurity6.x、Vue3、TypeScript、highlight demo所需要的依赖及其对应版本号 pom 配置文件 这里是最基础的MySQL的配置信息 application 1.1、代码生成器源码目录 这里是代码生成器的源

    2024年01月19日
    浏览(33)
  • 手把手教你租用服务器以及使用Pycharm远程连接服务器训练模型

    由于模型优化过后训练时间太长,所以想使用显卡或者租服务器进行训练,but显卡太贵(只有A卡),那就租服务器好了,开始了解怎么租,去哪租一系列问题,果然只要开始思考,就是一个接一个的困难,直接被击碎。终于找到了AutoDL,美美的开始租服务器,结果又绊在了选

    2024年02月10日
    浏览(46)
  • 手把手教你在winform中将文本或文件路径拖到控件中

    我们在winform开发中经常有这类需求:我们需要将文件,比如txt文件的所有内容复制到 RichTextBox控件上,或者需要将txt文件的某一行内容移动到 RichTextBox控件上,这些功能是怎么实现的呢?请接着往下看。 本人2017年硕士毕业,行业经验六年+,一直在自动化行业从事上位机软件

    2024年02月09日
    浏览(39)
  • AIGC|超详细教程提升代码效率,手把手教你如何用AI帮你编程

    目录 一、辅助编程 (一)代码生成 二、其他功能 (一)工具手册 (二)源码学习 (三)技术讨论 作为主要以 JAVA 语言为核心的后端开发者,其实,早些时间我也用过比如 Codota、Tabnine、Github 的 Copilot、阿里的 AI Coding Assistant 等 IDEA 插件,但是我并没有觉得很惊奇,感觉就

    2024年02月04日
    浏览(42)
  • 如何一键生成字幕,如何快速处理生肉资源?借助whisper语音识别系统生成.srt字幕文件 手把手教学在Windows、CPU版本下whisper的安装与使用,快速上手!

    Whisper是Open AI开源的语音识别网络,支持98中语言,用于语音识别和翻译等任务。我们可以将歌曲的歌词进行识别,将无字幕的视频资源自动生成字母,极大方便了用户。同时,whisper可以在本地运行,充分保障了个人隐私。在识别方面也具有较准确的识别能力。 因此想通过本

    2024年02月02日
    浏览(30)
  • 变现 起航篇! 手把手交你用chatgpt快速生成视频!

    Chatgpt 很多同学都用的非常熟练了,但是都停留在文字阶段,有没有更好玩的用法,可以深度的利用chatgpt做一些事情呢? 今天菜哥就找一个方法可以快速利用chatgpt制作视频,整个过程大概3分钟,非常有趣,让人眼前一亮,我们一起来看一下。整个的过程会用到2个工具: 一

    2024年02月08日
    浏览(35)
  • 手把手教你用AI 随心所欲生成喜欢的图片

    首先放一张 AI 生成的小姐姐图片,怎么样,是不是很养眼? 使用ChatGPT 有一段时间了,都是文字交互,还没有尝试过用 AI 作图。趁着假期,体验了下通过 AI 用文字生成图片。 接下来根据我的试用经验,手把手教你如何在自己本地使用 AI 工具随心所欲生成自己喜欢的图片。

    2024年02月21日
    浏览(49)
  • 手把手教你如何扩展(破解)mybatisplus的sql生成

    众所周知, mybatisplus 提供了强大的代码生成能力,他默认生成的常用的CRUD方法(例如插入、更新、删除、查询等)的定义,能够帮助我们节省很多体力劳动。 他的 BaseMapper 中定义了这些常用的CRUD方法,我们在使用时,继承这个 BaseMapper 类就默认拥有了这些能力。 如果我们

    2024年02月05日
    浏览(36)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包