WGAN基本原理及Pytorch实现WGAN-Toy模板网

这篇具有很好参考价值的文章主要介绍了WGAN基本原理及Pytorch实现WGAN。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

1.WGAN产生背景

（1）超参数敏感

（2）模型崩塌

2.WGAN主要解决的问题

3.不同距离的度量方式

（1）方式一

（2）方式二

（3）方式三

（4）方式四

4.WGAN原理

（1）p和q分布下的距离计算

（2）EM距离转换优化目标推导

（3）判别器和生成器的优化目标

5.WGAN训练算法

6.WGAN网络结构

7.数据集下载

8.WGAN代码实现

9.mainWindow窗口显示生成器生成的图片

10.模型下载

GAN原理及Pytorch框架实现GAN（比较容易理解）

Pytorch框架实现DCGAN（比较容易理解）

CycleGAN的基本原理以及Pytorch框架实现

1.WGAN产生背景

之所以会产生WGAN，主要是因为GAN网络模型训练困难的问题，其中主要体现在GAN模型对超参数比较敏感，需要精心挑选才能使模型训练起来，并且也会出现模式崩塌的现象。

（1）超参数敏感

超参数敏感是指网络的结构设定，学习率，初始化状态等超参数对网络的训练过程影响比较大，微量的超参数调整将可能导致网络的训练结果截然不同。

左图：表示使用WGAN算法训练的结果；

右图：表示标准的GAN在不使用Batch Normalization层导致网络训练不稳定，无法收敛，生成的样本与真实样本之间差距很大。

为了更好的训练GAN网络，DCGAN论文的作者提出了不使用Pooling层，多使用Batch Normalization层，不使用全连接层，生成网络中激活函数应使用ReLU，最后一层使用tanh激活函数，判别网络激活函数应使用LeakReLU等一系列经验性的训练技巧。

但是上面的技巧仅仅能在一定程度上避免出现训练不稳定的现象，并没有从理论上解释为什么会出现训练困难以及如何解决训练不稳定的问题。

（2）模型崩塌

模型崩塌(Mode Collapse)是指模型生成的样本单一，多样性很差的现象。

由于判别器只能鉴别单个样本是否为真实样本分布，并没有对多样性进行显式约束，导致生成模型可能倾向于生成真实分布的部分区间中的少量高质量样本，以此来在判别器中获得较高的概率值，而不会学习到全部的真实分布。

模式崩塌在GAN的训练过程中比较常见。在训练过程中，通过可视化生成网络的样本，可以看到，生成的图片种类非常单一，生成网络总是倾向于生成某一种单一风格的样本图像。

2.WGAN主要解决的问题

引入了一种新的分布距离度量方法：Wasserstein距离，也称为(Earth-Mover Distance)简称EM距离，表示从一个分布变换到另一个分布的最小代价。
定义了一种称为Wasserstein GAN的GAN形式，该形式使EM距离的合理有效近似最小化，并且本文从理论上证明了相应的优化问题是合理的。
WGAN解决了GANs的主要训练问题。特别是，训练WGAN不需要维护在鉴别器和生成器的训练中保持谨慎的平衡，并且也不需要对网络架构进行仔细的设计。模式在GANs中典型的下降现象也显著减少。WGAN最引人注目的实际好处之一是能够通过训练鉴别器进行运算来连续地估计EM距离。绘制这些学习曲线不仅对调试和超参数搜索，但也与观察到的样品质量。