【GitHub】VQGAN+CLIP代码从零开始复现

这篇具有很好参考价值的文章主要介绍了【GitHub】VQGAN+CLIP代码从零开始复现。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

论文地址

GitHub地址  

论文讲解

从开放领域的文本提示中生成和编辑图像是一项具有挑战性的任务,到目前为止,需要昂贵的和经过专门训练的模型。我们为这两项任务展示了一种新的方法,它能够通过使用多模态编码器来指导图像的生成,从具有显著语义复杂性的文本提示中产生高视觉质量的图像,而无需任何训练。我们在各种任务上证明了使用CLIP来指导VQGAN产生的视觉质量比之前不太灵活的方法如minDALL-E、GLIDE和Open-Edit更高。
 

【GitHub】VQGAN+CLIP代码从零开始复现

 代码复现

1.创建conda环境并激活进入

conda create --name vqgan python=3.9
conda activate vqgan

2.安装pytorch

两种方法:

(1)通过镜像下载

添加中科大镜像源:

conda config --add channels https://mirrors.ustc.edu.cn/anaconda/pkgs/free/
 
conda config --set show_channel_urls yes
 

添加镜像之后,直接利用中科大源进行pip下载:

pip3 install torch torchvision torchaudio -i https://pypi.mirrors.ustc.edu.cn/simple/

 (2)vpn下载

挂上vpn后直接运行:

注意:我使用的是3090显卡,所以cuda版本要求11.3以上(建议是11.6)

conda install pytorch torchvision torchaudio cudatoolkit=11.6 -c pytorch -c conda-forge

3.安装环境依赖

这里默认会下载一次最新的torch(目前是1.12.1),如果上一步安装的不是1.12.1可能会再下载一次torch

pip install ftfy regex tqdm omegaconf pytorch-lightning IPython kornia imageio imageio-ffmpeg einops torch_optimizer setuptools==59.5.0

4.在git上克隆VQGAN-CLIP,cd到VQGAN-CLIP文件夹下再克隆CLIP和VQGAN

 
git clone 'https://github.com/nerdyrodent/VQGAN-CLIP'
cd VQGAN-CLIP
git clone 'https://github.com/openai/CLIP'
git clone 'https://github.com/CompVis/taming-transformers'

5.运行download_models.sh脚本文件下载基于imagnet的VQGAN预训练模型

(1)先给download_models.sh脚本添加权限:

chmod u+x download_models.sh

(2)运行download_models.sh,下载预训练模型

./download_models.sh

6.运行generate.py文章来源地址https://www.toymoban.com/news/detail-411497.html

python generate.py -p "A painting of an apple in a fruit bowl"
 
                    

到了这里,关于【GitHub】VQGAN+CLIP代码从零开始复现的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 怎么从零开始运行github / 现成的项目

    这篇博客是作为非计软科班出身的我记录的一些经验,希望得到交流和批评 目录 环境配置 通过文件命名了解项目 demo 代码运行的入口 设定参数的文件 build 通过代码了解项目 @装饰器 一些交流时用到的术语 API 交流或者开始自己敲代码时可能用到的知识 见环境配置的代码

    2023年04月08日
    浏览(45)
  • 从零开始实现放置游戏(十七)——完结篇(附DEMO地址)

    大家好,时隔2年多,我来填坑啦! 之前用的技术、设计思路都不成熟,所以直接干掉重做了。 由于从头教学实在太啰嗦,精力也有限,咱们还是直接上源码吧。 http://212.129.154.59:5173/ (大家快看呀,服务器11月底就要过期了) 由于之前网盘过期了,文件全被删除了。所以这

    2024年02月13日
    浏览(36)
  • 多模态表征—CLIP及中文版Chinese-CLIP:理论讲解、代码微调与论文阅读

    我之前一直在使用CLIP/Chinese-CLIP,但并未进行过系统的疏导。这次正好可以详细解释一下。相比于CLIP模型,Chinese-CLIP更适合我们的应用和微调,因为原始的CLIP模型只支持英文,对于我们的中文应用来说不够友好。Chinese-CLIP很好地弥补了这方面的不足,它使用了大量的中文-文

    2024年03月15日
    浏览(41)
  • C++ Webserver从零开始:配置环境(九)——下载github的项目进行测试

    大家好,我又来更新Webserver的博客了。上一次更新这个专栏时2024.2.5号,离现在已经13天了。非常抱歉,中间隔了那么久。一方面是基础知识学完之后,就要开始自己写代码了。看基础知识和写代码是两回事,理论和实践的区别还是非常大的。所以我对自己的要求是要完成一部

    2024年02月20日
    浏览(56)
  • 从零开始:VuePress2 + GitHub Pages 搭建你的第一个免费博客网站

    可能你也想拥有一个属于自己的博客网站,但是自己搭个博客网站不知道从何下手,而且还需要租个云服务器,虽然一个月只需几十块钱,但是我们的博客网站是要长期维护的,日积月累也要不少钱呢。 现在我就教你用 VuePress2 + GitHub Pages 搭建个人博客网站,不用服务器,完

    2024年02月04日
    浏览(53)
  • 从零开始搞基建(5)——代码质量

    AppWorks 是一款基于 VS Code 插件的前端研发工具集。 1)AppWorks Doctor 我试用了其中的 代码质量 检测插件,这款插件会依赖 package.json 文件。 所以当前项目的根目录中需要包含此文件,否则无法运行命令。 在 Mac 环境中,Ctrl+Shift+P 快捷键后弹出命令框,选择 AppWorks: Scan Your Pro

    2024年02月04日
    浏览(26)
  • 从零开始实现贪吃蛇(完整代码)

    本文将分为三个部分来讲解贪吃蛇的实现,分为贪吃蛇开始前的游戏画面、游戏中画面、游戏结束画面,那我们开始吧! 游戏在开始前都会有一个的画面,一般而言是提供选择,如童年回忆《坦克大战》,在开始前会提供一个画面供玩家选择,单人模式或者双人模式,而我们

    2024年02月12日
    浏览(36)
  • 深度学习Github项目实例复现:从虚拟环境安装到得出代码的复现结果

    希望你要有耐心一步一步做完,你一定会有收获! 1.Anaconda官网链接(版本随意) 2.笔者自己版本的度盘Anaconda链接 安装时需要注意的点:(不重要的安装步骤省略了) 这里最好装在空间大的盘,因为要在它的目录下装很多虚拟环境,虚拟环境还挺大的,我装在空间大的E盘。

    2024年02月08日
    浏览(56)
  • 【FedAvg论文笔记】&【代码复现】

    目录 一、FedAvg原始论文笔记 1、联邦优化问题:  2、联邦平均算法: FedSGD算法: FedAvg算法: 实验结果: 3、代码解释  3.1、main_fed.py主函数 3.2、Fed.py: 3.3、Nets.py:模型定义 3.4、option.py超参数设置 3.5、sampling.py: 3.6、update.py :局部更新 3.7、main_nn.py对照组 普通的nn 联邦平均算法

    2024年02月01日
    浏览(39)
  • 从零开始:手写 JavaScript 代码应用于实际场景

    ​🌈个人主页:前端青山 🔥系列专栏:JavaScript篇 🔖 人终将被年少不可得之物困其一生 依旧 青山 ,本期给大家带来JavaScript篇专栏内容:JavaScript-场景应用 目录 三、场景应用 1. 循环打印红黄绿 (1)用 callback 实现 (2)用 promise 实现 (3)用 async/await 实现 2. 实现每隔一秒打

    2024年02月03日
    浏览(63)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包