首页 > 其他分享> 文章详细

论文解释：SeFa ，在潜在空间中为 GAN 寻找语义向量

2022-03-06 12:31:50 阅读：241 来源： 互联网

标签：采样 GAN SeFa 向量图像 PCA 潜在中为

动机

GAN 中的生成器通常以随机采样的潜在向量 z 作为输入，生成高保真图像。通过改变潜在向量 z，我们可以改变输出图像。

然而，为了改变输出图像中的特定属性（例如头发颜色、面部表情、姿势、性别等），我们需要知道移动潜在向量 z 的特定方向。

以前的一些文章试图以监督的方式解释潜在的语义。他们通常标记数据集并训练属性分类器来预测图像的标签，然后计算每个标签的潜在代码 z 的方向向量。虽然这项任务有一些无监督的方法，但它们中的大多数都需要模型训练和数据采样。

论文提出了一种名为 SeFa 的封闭形式和无监督方法，可以无需数据采样和模型训练并找出这些方向向量来改变输出图像中的不同属性。

封闭形式的解决方案是具有有限数量的标准操作的数学表达式。
“无监督”一词意味着我们不需要标记数据集。

移动潜在代码

为了有意义地改变潜在代码，需要首先识别一个语义上有意义的方向向量 n。新的潜在代码计算为 z'=z+αn，其中 α 是朝向 n 方向的步数。

问题是我们如何找出语义上有意义的方向向量 n？

SeFa - 语义分解

最先进的 GAN 模型通常由多个层组成。每一层都学习从一个空间到另一个空间的转换。论文的重点研究第一个变换，它可以表述为仿射变换，如下所示。

如果我们将 z'=z+αn 应用于输入潜在代码，则第一个转换公式可以简化如下。

由于G₁(z+αn)=G₁(z)+αAn，我们知道如果给定一个潜在码z和方向向量n，则可以通过在变换后的投影码上加上αAn来实现编辑过程。

从这个角度来看，权重参数A应该包含图像变化的基本知识。因此，可以通过分解 A 来发现重要的潜在方向。

SeFa 算法类似于之前的 PCA 方法。但是它不是将 PCA 应用于投影的潜在代码 G₁(z)=y，而是直接将非常相似的过程应用于投影层的权重（G₁ 的权重）。

就像 PCA 一样，这个过程也是为了找出在 A 的投影后可能导致较大变化的方向向量。它被表述为以下优化问题。

完整文章:

https://www.overfit.cn/post/e9e614d774f743509fc9ede06e8c16f9

标签：采样,GAN,SeFa,向量,图像,PCA,潜在,中为
来源： https://www.cnblogs.com/deephub/p/15971316.html

本站声明： 1. iCode9 技术分享网（下文简称本站）提供的所有内容，仅供技术学习、探讨和分享；
2. 关于本站的所有留言、评论、转载及引用，纯属内容发起人的个人观点，与本站观点和立场无关；
3. 关于本站的所有言论和文字，纯属内容发起人的个人观点，与本站观点和立场无关；
4. 本站文章均是网友提供，不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属；如您发现该文章侵犯了您的权益，可联系我们第一时间进行删除；
5. 本站为非盈利性的个人网站，所有内容不会用来进行牟利，也不会利用任何形式的广告来间接获益，纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

ICode9

论文解释：SeFa ，在潜在空间中为 GAN 寻找语义向量

动机

移动潜在代码

相关研究——PCA 方法

SeFa - 语义分解