ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

10分钟看懂PCA

2022-01-21 23:03:26  阅读:140  来源: 互联网

标签:10 协方差 矩阵 分钟 降维 维度 PCA 向量


PCA的目标

有利于简化计算,降低模型复杂度,便于数据可视化。

核心思想

就是抓住主要矛盾

一个简单的例子:现在要通过照片来识别一个人。整个拍照的过程就是一个将3维的人降维到2维。我们通过照片就能够识别照片中的人。这就是PCA要做的事情。在举一个例子就是在平常的学习中物理与数学科目的相关性很强,如果我们知道了一个同学的数学成绩很好那么大概率就能知道该同学的物理学的不错。在这里我们就能够使用数学(一个维度)来评估该同学的理科素质(多个维度)。同时降维之后尽可能留下有用的维度,也就是留下的维度尽可能的独立这样我们就能够用尽可能少的维度表出最大的信息量。

降维的原则

我们有多个角度,从正面拍照,从头顶拍照,从侧面拍照等等。常识知道从正面拍照是一个不错的选择,正面的照片展示最多的信息量(相比较其他的几个角度来说)。如果将照片的例子联系到一般的数据上,数据有好多投影的方向,如果降维之后的数据特别密集(相当于拍照的时候从头顶拍下去)那么就会损失很多的信息量。最好的方式就是选择一个方向使得降维之后的数据密度最小,这个方向就是方差最大的方向。方差最大的方向数据离散程度比较高按照这个方向“拍平”数据得到的就是最大方差投影

PCA的核心数学知识点

在数学方面的两个知识点

1.基变换向量投影

一个向量在另一个向量上的投影就是这个向量与该方向单位向量的乘积。那么一个向量与一个标准正交基相乘得到的就是这个向量在新的基下的坐标。

2.协方差归零投影

 如果一个列向量代表一个人,设列构成的矩阵设为。将A做归零化得到B,则B * B.T就是协方差矩阵。

 在上面提到我们要使得降维之后的向量相关性越小越好。而向量的相关性可以用协方差来表示,所以我们的下一步目标就是将该矩阵对角化。只留下对角线元素,也就是我们熟悉的矩阵的对角化了。而且对角线的元素正是我们方差。

整个PCA的pipeline

1. 得到协方差矩阵。

2.将协方差矩阵(对称矩阵)正交对角化。

3.使用方差最大化原则将对角线的值倒序排列。比如我们要降到k维(k < 原始向量维度)就将topk的特征值对应的特征向量找出来。这时候的特征向量为正交基。

4.将k个特征向量构成的矩阵 * 原始矩阵A得到降维之后的矩阵。

标签:10,协方差,矩阵,分钟,降维,维度,PCA,向量
来源: https://blog.csdn.net/qq_34993631/article/details/122630172

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有