首页 > 其他分享> 文章详细

计算机视觉-生成模型

2021-11-28 19:00:07 阅读：204 来源： 互联网

标签：计算机训练特征模型样本生成 GAN 视觉判别

生成模型

给定训练集，产生与训练集同分布的新样本。

希望学到一个模型，其与训练样本的分布相近。

无监督学习里的一个核心问题：密度估计问题。

典型思路：

显式的密度估计：显示的定义并求解分布。
隐式的密度估计：学习一个模型，而无需显示的定义它。

显式地密度模型：PixelRNN与PixelCNN

利用链式准则将图像x的生成概率转变为每个像素生成概率的乘积。

缺点是：像素的生成是序列的进行训练，生成整张图片的效率太慢了。

二者的优点：似然函数可以精确计算；利用似然函数的值可以有效地评估模型性能。

二者的缺点：序列产生=>慢

VAE（变分自编码）

无监督的特征学习，其目标是利用无标签数据找到一个有效地低维的特征提取器。

对输入数据进行降维，采用的方法是自编码器（早先使用的方法是线性方法，后来出现了全连接神经网络，最后使用卷积神经网络）。

特征降维的作用是：希望降维后的特征仅保留数据中有意义的信息。

整体的方法就是将输入数据通过编码器提取特征，然后对特征使用解码器重构输入数据，也就是保证输出和输入尽可能的重合。

经过训练后的编码器就可以用于分类任务，但是效果没有直接用VGG等的好，因为它保留的是样本特征，而没有特别保留样本间的区别特征，但是在分类中，这个样本间的区别特征或许会更加的重要。而训练后的解码器就可以用于生成图片，类似于给定一个数据，可以通过解码器自动生成一张数字图片等。

优点：生成模型里的一种主要方法，可以计算出一个特征，这个特征表示可以用在其他的许多任务重。

缺点：最大化似然函数的下边界能够有效地工作，但是模型不好评估；与GAN相比，产生的样本模糊，质量较低。

生成对抗网络GAN

问题：希望从训练样本分布中采样新数据，但这个分布不仅维度高而且还很复杂，难以直接实现。

解决方案：对一个简单的分布采样，比如均匀分布；然后，学习一种映射将其变换到训练样本分布。

生成网络：期望能够产生尽量真实的图片，进而骗过判别器。

判别网络：期望能够准确的区分真假图片。

在这个过程中采用的是minimax的方式联合训练。基本流程是首先训练判别，是的整个式子的值尽可能的大。然后训练生成器，是的能够尽量的骗过判别器，让判别器输出结果为1。

GAN总结：

不需要显式地密度函数定义
采用了游戏理论方法：利用2个玩家的博弈，来学习训练数据的分布。
优点：优雅，目前最好的生成效果。
缺点：很难训练，非常不稳定；无法计算出样本或者隐变量的概率。
领域热点：更好的损失函数，更稳定的训练方法（Wasserstein GAN，LSGAN等等）；条件GANs（Conditional GANs），将GANs应用于多种任务。

DCGAN：

DCGAN构架在训练过程中状态稳定，并可以有效实现高质量的图片生成，因此，现在的很多GAN都是在它的基础上进行改进的。

DCGAN提了四种规则：

使用卷积层代替池化层。
去除全连接层。
使用批归一化。
使用恰当的激活函数：生成网络使用ReLU，输出层采用Tanh；判别器使用LeakluReLU。

LSGAN：

GAN网络在训练时经常出现D太过于强大，很快就能分出真假，一些点离决策边界非常远，所处位置梯度是0.这部分样本很难被拉到真实点附近。

解决方案：将判别器任务由分类改成回归任务。

WGAN：

推土机距离：

γ表示需要从xp中拿多少土放入xq中，二范式表示xp和xq之间的距离。然后推土机距离是要在所有方案中选择那个最小的距离方案。

条件GAN：

问题：

存在标签1对多的问题，传统的神经网络的输出结果和每个训练结果都尽量接近，导致生成图像非常模糊，甚至无法分辨。
期望输出内容是多样的，是可以被控制的。

ACGAN：

# 生成模型
---
给定训练集，产生与训练集同分布的新样本。
希望学到一个模型，其与训练样本的分布相近。
无监督学习里的一个核心问题：密度估计问题。
典型思路：
* 显式的密度估计：显示的定义并求解分布。* 隐式的密度估计：学习一个模型，而无需显示的定义它。
### 显式地密度模型：PixelRNN与PixelCNN
利用链式准则将图像x的生成概率转变为每个像素生成概率的乘积。
![image-20211125195923837](C:\Users\Administrator\AppData\Roaming\Typora\typora-user-images\image-20211125195923837.png)
缺点是：像素的生成是序列的进行训练，生成整张图片的效率太慢了。
二者的优点：似然函数可以精确计算；利用似然函数的值可以有效地评估模型性能。
二者的缺点：序列产生=>慢
### VAE（变分自编码）
---
无监督的特征学习，其目标是利用无标签数据找到一个有效地低维的特征提取器。
对输入数据进行降维，采用的方法是自编码器（早先使用的方法是线性方法，后来出现了全连接神经网络，最后使用卷积神经网络）。
特征降维的作用是：希望降维后的特征仅保留数据中有意义的信息。
整体的方法就是将输入数据通过编码器提取特征，然后对特征使用解码器重构输入数据，也就是保证输出和输入尽可能的重合。
经过训练后的编码器就可以用于分类任务，但是效果没有直接用VGG等的好，因为它保留的是样本特征，而没有特别保留样本间的区别特征，但是在分类中，这个样本间的区别特征或许会更加的重要。而训练后的解码器就可以用于生成图片，类似于给定一个数据，可以通过解码器自动生成一张数字图片等。
优点：生成模型里的一种主要方法，可以计算出一个特征，这个特征表示可以用在其他的许多任务重。
缺点：最大化似然函数的下边界能够有效地工作，但是模型不好评估；与GAN相比，产生的样本模糊，质量较低。
## 生成对抗网络GAN
---
问题：希望从训练样本分布中采样新数据，但这个分布不仅维度高而且还很复杂，难以直接实现。
解决方案：对一个简单的分布采样，比如均匀分布；然后，学习一种映射将其变换到训练样本分布。
**生成网络：**期望能够产生尽量真实的图片，进而骗过判别器。
**判别网络：**期望能够准确的区分真假图片。
在这个过程中采用的是minimax的方式联合训练。基本流程是首先训练判别，是的整个式子的值尽可能的大。然后训练生成器，是的能够尽量的骗过判别器，让判别器输出结果为1。
**GAN总结：**
* 不需要显式地密度函数定义* 采用了游戏理论方法：利用2个玩家的博弈，来学习训练数据的分布。* 优点：优雅，目前最好的生成效果。* 缺点：很难训练，非常不稳定；无法计算出样本或者隐变量的概率。* 领域热点：更好的损失函数，更稳定的训练方法（Wasserstein GAN，LSGAN等等）；条件GANs（Conditional GANs），将GANs应用于多种任务。
**DCGAN：**
DCGAN构架在训练过程中状态稳定，并可以有效实现高质量的图片生成，因此，现在的很多GAN都是在它的基础上进行改进的。
DCGAN提了四种规则：
* 使用卷积层代替池化层。* 去除全连接层。* 使用批归一化。* 使用恰当的激活函数：生成网络使用ReLU，输出层采用Tanh；判别器使用LeakluReLU。
**LSGAN：**
GAN网络在训练时经常出现D太过于强大，很快就能分出真假，一些点离决策边界非常远，所处位置梯度是0.这部分样本很难被拉到真实点附近。
解决方案：将判别器任务由分类改成回归任务。
**WGAN：**
推土机距离：
![image-20211128150328726](C:\Users\Administrator\AppData\Roaming\Typora\typora-user-images\image-20211128150328726.png)
γ表示需要从xp中拿多少土放入xq中，二范式表示xp和xq之间的距离。然后推土机距离是要在所有方案中选择那个最小的距离方案。
**条件GAN：**
问题：
* 存在标签1对多的问题，传统的神经网络的输出结果和每个训练结果都尽量接近，导致生成图像非常模糊，甚至无法分辨。* 期望输出内容是多样的，是可以被控制的。
**ACGAN：**

标签：计算机,训练,特征,模型,样本,生成,GAN,视觉,判别
来源： https://www.cnblogs.com/codezzlove/p/15616198.html

本站声明： 1. iCode9 技术分享网（下文简称本站）提供的所有内容，仅供技术学习、探讨和分享；
2. 关于本站的所有留言、评论、转载及引用，纯属内容发起人的个人观点，与本站观点和立场无关；
3. 关于本站的所有言论和文字，纯属内容发起人的个人观点，与本站观点和立场无关；
4. 本站文章均是网友提供，不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属；如您发现该文章侵犯了您的权益，可联系我们第一时间进行删除；
5. 本站为非盈利性的个人网站，所有内容不会用来进行牟利，也不会利用任何形式的广告来间接获益，纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

ICode9

计算机视觉-生成模型

生成模型

显式地密度模型：PixelRNN与PixelCNN

VAE（变分自编码）

生成对抗网络GAN