1.TSNE
算法思想:
(1)SNE,其基本思想为在高维空间相似的数据点,映射到低维空间距离也是相似的。算法利用距离表达两个点之间的相似性。常用的距离度量方式是:欧式距离。
(2)t-SNE,做出的优化是用t分布取代SNE中的高斯分布,使得降维后的数据,同类之间更加紧凑,不同类之间距离加大。换言之,对应于无监督聚类指标轮廓系数更好。
2.PCA
算法思想:将原有的n个特征,投影到k为空间,k维度空间之间两两正交称为主成分,新的特征由原特征变换而来。
算法实现:
在python中通过调用模块sklearn,两者都是封装好的函数,参考函数文档调参即可。