发布网友 发布时间:2022-04-20 01:47
共1个回答
热心网友 时间:2023-06-25 17:10
首先假设有一组数据,每个数据x=(x1,x2,....xd),即每个数据有d个分量,也就是说d维空间内的一些点组成的点集合。先说一下主成分分析的作用。它用来寻找这些数据点的大体分布方向。首先你知道,d维空间内的任何d个无关向量组可以构成d维空间的一个基底。同理,主成分可以求出d个主成分,这些主成分就是它的一个基底,但是这组基底是有明显的含义的,第一主成分个反映了你这组数据的最大的分布方向,如果你以它在数据中心处画一个方向向量,你会发现它基本上反映了这些数据的一个基本走势,第二个就是第二大体现分布的方向,如果没有记错它和第一个是正交的依次类推。说到这里你该明白了吧,如果你想把d维数据压缩到2维,还要不丢失太多信息,就可以用前两个方向作为新的坐标轴建立二维坐标系了,可以在尽可能少损失数据信息的前提下压缩数据。聚类分析的作用是来自动的对这组数据进行分类。比如,这组数据你知道是由若干个类组成的,但是不幸的是你不知道哪个样本属于哪个类,也不知道每个类的任何信息。聚类分析尝试给出数据的一个自动划分,当然你自己要根据需要设定一定的准则来运行聚类分析。因为,聚类结构本身是一个人为的主观概念,你的准则符合你的期望即可。另外,补充一下,主成分分析与聚类分析都是模式识别中的无监督方法。不知道你满意么 ,都是自己打的,给点分啊