对于pix2pix的介绍以及实现

这篇具有很好参考价值的文章主要介绍了对于pix2pix的介绍以及实现。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

最近读了pix2pix的相关文章,也是关于对抗生成的。它与之前接触的GAN有挺大的不同。比如从训练集来说,它是进行成对的训练(接下来会介绍),损失函数的不同比如加入了L1损失,以及生成器的输入,以及判别器都有了很大的不同,接下来会为大家一一介绍。

1  生成器UNET

首先先介绍生成器的部分,生成器使用了UNET的生成网络结构如下图

对于pix2pix的介绍以及实现

这个图我是在github中截取的。简单的介绍一下生成器的结构。首先从上图最左边输入一张图片,经过两次的卷积变成64个通道,紧接着经过一次池化层不改变通道数,只是把图像的大小变为原来的一半,紧接着操作类似,直到变成最底下的1*512*32*32的这种类型(batchsize=1,通道数为512,图片大小32*32)再次经过两个卷积层变成1*1024*28*28这种类型。之后在看中间的这个箭头它的意思就是合并举个例子就是说,图片最下面的第一个箭头它是由左边的1*512*64*64和右边的经过上采样之后得到的图片1*512*56*56进行通道的拼接。可以看到这里的图片的大小并不是不同的,经过查资料发现可能是做了一些修剪,之后接下来的过程以此类推,不断的进行拼接,最后生成图像。

到这里其实已经没有什么问题了,但是在实现代码中发现,我的生成器结构与文中的略有不同比如我没有使用过池化层或者是连续的两次卷积,经过请教其实多一点少一点并不会有多大的问题,只要好用就行了,如果你的效果比他还好的话,那么就相当于一个小小的创新,不要太在意这些细节,抓住主要的即可。

2  判别器PATCHGAN

刚读文章的时候,文章里介绍会把图片分割成70*70的图片,判断每一个图片的真实值,之后再取平均。我一开始以为是把图片分成70块,判断每一块的真实值,但实际在代码中却是一个个卷积层,并没有看到分割的过程,所以查了一查后来发现分割操作其实卷积层已经完成了,这里涉及到感受野的部分,你可以把它理解一个卷积核可以覆盖的范围,经过最后的计算,最后确实是70*70的大小。这里不过多的介绍感受野,可能以后会写一些关于这部分的内容下面给出鉴别器的结构图:

对于pix2pix的介绍以及实现

 3  pix2pix结构图

首先先把结构图给大家看看:

对于pix2pix的介绍以及实现

 首先从左边生成器开始讲,我认为它的结构和cgan相同,首先是一个真实的轮廓或者是标签图片放入生成器中进行训练,之后再将生成的假图片和真实的也就是刚刚放入生成器中的真实轮廓放入鉴别器中,在代码中是合并在一起变成6个通道进行训练。鉴别器是放入真实的图片和它的轮廓图片放在一起进行训练。整体结构较为简单,实际效果还不错。具体的损失函数比较简单就是一个生成对抗损失加上一个生成图片和真实图片的L1损失加起来,放入生成器优化器中进行训练。

对于pix2pix的介绍以及实现

 4  实验结果

最后给出我的运行结果:

对于pix2pix的介绍以及实现

 如果大家需要这个代码,大家可以在评论区回复,我再把链接发给大家,因为这是很久之前跑的程序,找起来还是有点麻烦。

大家和我要的代码我一般看见了就发了,一般三到七天吧因为我不经常看,大家要是收到的话可以回我一下,我怕大家没有收到。之后我自己其实也学了一些其他的gan比如stylegan之类的文章,只是因为其他人写的特别好,我就没怎么写,大家有关gan的问题可以问问我,如果我知道的话我一定会给大家解答的,gan真的是比较有意思。文章来源地址https://www.toymoban.com/news/detail-462899.html

到了这里,关于对于pix2pix的介绍以及实现的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 第二十三章 原理篇:Pix2Seq

    大夏天我好像二阳了真是要命啊。 现在找到工作了,感觉很快乐,但是也有了压力。 《论你靠吹牛混进公司后该怎么熬过试用期》 希望自己能保持学习的习惯!加油! 参考教程: https://arxiv.org/pdf/2109.10852.pdf https://github.com/google-research/pix2seq https://zhuanlan.zhihu.com/p/421851551 ht

    2024年02月13日
    浏览(35)
  • 使用 InstructPix2Pix 对 Stable Diffusion 进行指令微调

    本文主要探讨如何使用指令微调的方法教会 Stable Diffusion 按照指令 PS 图像。这样,我们 Stable Diffusion 就能听得懂人话,并根据要求对输入图像进行相应操作,如: 将输入的自然图像卡通化 。 图 1 :我们探索了 Stable Diffusion 的指令微调能力。这里,我们使用不同的图像和提示

    2024年02月10日
    浏览(89)
  • pix2tex - LaTeX OCR 安装使用记录

    项目地址:这儿 版本要求 Python: 3.7+ PyTorch: =1.7.1 安装: 注意:Pyside6 和 PyQt6 版本需要保持一致,否则会报 QT 错误 打开 Windows 终端,输入命令: 注意:需要将 latexocr.exe 所在路径添加到系统 Path 路径下,以便找到该可执行文件 例如: 可以识别出来,如果识别有错误,可以直

    2024年02月06日
    浏览(53)
  • windows下安装与使用pix2tex(mathpix免费替代版)

    历经千辛万苦终于实现了跟mathpix一样的使用方式,毕竟咱们懒人既然都懒得打公式了,那必然是懒得存图片改代码的,有没有像mathpix一样可以直接截图识别的方法呢?yes! 官方开源地址 下载完pix2tex之后还要下载gui包: 中间可能会出现很多错误,大都是版本不兼容或者缺少

    2024年02月06日
    浏览(30)
  • UC伯克利提出AIGC图像编辑新利器InstructPix2Pix,AI模型P图更加精细

    原文链接:https://www.techbeat.net/article-info?id=4375 作者:seven_ 最近的一些工作向我们展示了 AIGC在创造性生成图像、视频等方面 的潜力,相信已有很多研究者在沿着这一方向进行拓展式的挖掘和创新。目前已有很多衍生应用出现在了大家眼前,例如仅 通过手绘草图生成具有真实

    2024年02月09日
    浏览(44)
  • 【UAV】Pix4D Mapper介绍&安装包

             Pix4D Mapper是一款专业的无人机航空三维建模软件,可以将通过无人机拍摄的照片转化为三维地图、模型、点云、高精度的数字高程模型(DEM)、数字表面模型(DSM)和正射影像(DOM)等等。         Pix4D Mapper可以处理来自各种不同无人机的影像数据,可以制作

    2024年02月09日
    浏览(178)
  • 基于pix实现无人机编队表演

    自制无人机灯光秀(一):主要技术简介 编队灯光表演没有什么高深的技术,主要是一些应用层的开发。 适宜人群: 高中及以上学历 无人机爱好者 硬件准备: pixhawk2.4.8 四轴无人机 wifi数传 一台电脑或安卓手机 软件准备: PX4 1.13.3(飞控) QGC 4.2.4 (地面站) Blender 3.5 (舞

    2024年02月10日
    浏览(37)
  • Java——二叉树的最近公共祖先及二叉搜索树介绍

    目录 二叉树的最近公共祖先 题目  思路一:如果给定的是一颗二叉搜索树, 思路二:假设是孩子双亲表示法  二叉搜索树 定义Node类 查找 删除 插入 给定一个二叉树, 找到该树中两个指定节点的最近公共祖先。 百度百科中最近公共祖先的定义为:“对于有根树 T 的两个节点

    2023年04月08日
    浏览(39)
  • 爬虫基本原理介绍、实现以及问题解决

    1. 前言 爬虫作为网络数据采集的重要工具,在当今互联网时代具有不可替代的作用。通过爬虫,我们可以获取到丰富的网络数据,用于各种用途,包括数据分析、业务决策、舆情监测等。 2. 爬虫能做什么 爬虫可以用于获取互联网上的各种数据,无论是文字、图片、视频还是

    2024年04月14日
    浏览(36)
  • C语言内存函数介绍以及实现

    目录 前言 一:内存拷贝函数 (1)memcpy( )函数 (2)memove( )函数 二:内存比较函数 三:内存设置函数 本文介绍的函数的函数声明都在头文件string.h中。 函数声明:void* memcpy(void* dest,const void* src,size_t num) 作用:把一片内存空间的字节拷贝到另一片内存空间。 函数参数的意义: ①dest指

    2024年02月01日
    浏览(38)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包