一：CycleGAN

（1）概述

CycleGAN：它是一种实现图像风格转换功能的GAN网络。其实早在CycleGAN出现之前，就存在着Pix2Pix这样的模型进行图像风格转换，但是它的局限性很大，因为要求所输入的图片必须是成对的（paired），但在现实中这种图像很难收集。而CycleGAN不要求图像成对(unpaired)，所以非常实用

例如下图输入XXX的图片，可以是任意的，甚至是自己画的，然后YYY的图片是梵高风格的画像，CycleGAN训练之后就会把任何输入的图像转化为梵高风格的画像

在这里插入图片描述

其实不止是图像风格化，CycleGAN还可以运用在语音处理方面，例如声音的变声，可以把任意声音声音和郭德纲声音去训练，这样你说出的话就会被转换成郭德纲声音

（2）双判别器

CycleGAN的核心在于其双判别器结构，如下图

GGG：从X到Y的生成器
FFF：从Y到X的生成器
DXD_{X}DX：鉴别是否为XXX的鉴别器
DYD_{Y}DY：鉴别是否为YYY的鉴别器

训练时包含两个过程

由xxx经过GGG生成Y︿\mathop{Y}\limits^{︿}Y︿，然后将Y︿\mathop{Y}\limits^{︿}Y︿送入DYD_{Y}DY进行鉴别，再把Y︿\mathop{Y}\limits^{︿}Y︿送入F中生成x︿\mathop{x}\limits^{︿}x︿
由yyy经过FFF生成X︿\mathop{X}\limits^{︿}X︿，然后将X︿\mathop{X}\limits^{︿}X︿送入DXD_{X}DX进行鉴别，再把X︿\mathop{X}\limits^{︿}X︿送入G中生成y︿\mathop{y}\limits^{︿}y︿

在这里插入图片描述

（3）损失函数

损失函数：由对抗损失和Cycle Consistency损失构成

在这里插入图片描述

由XXX生成YYY和由YYY生成XXX这两部分损失函数和最初的GAN是一样的

在这里插入图片描述

单独对抗损失不能保证可以映射单个输入，举个例子：GGG和FFF可能合伙偷懒骗人，给GGG一个图，GGG偷偷把小狗变成梵高自画像，FFF再把梵高自画像变成输入。引入Cycle Consistency可以制止这种行为，他用梵高其他画作测试FG，用另外真实图片测试GF，看看是否可以变回原来的样子，这样做就保证了GF在整个X、Y分布区间的普适性

在这里插入图片描述

二：StyleGAN

（1）解耦表征学习

人工神经网络其本质就是在进行表征学习，但是他是一种黑盒算法，不具备可解释性，往往是通过大量数据训练出的结果，所以其泛化能力不是很高。这是因为，人工神经网络所学习到的特征是纠缠在一起的，或者说是耦合的，例如下图是一只狸花猫，人工神经网络可以轻易学习到这种猫的特征，但是如果换一种猫，甚至说只是换一个颜色，那可能效果就不尽如人意了，可以看到其颜色、形状、姿势等特征是耦合在一起的

在这里插入图片描述