如何利用Python进行主成分分析
1、本文以sklearn中的wine数据集为例来说明主成分分析。首先下载数据集。from sklearn import datasetswine=datasets.load_wine()X=wine.datay=wine.targettarget_names=wine.target_names
2、从机器学习包中导入主成分分析函数。from sklearn.decomposition import PCA
3、建立主成分,这里设主成分个数为2个,即n_components=2,其他参数为默认值。pca = PCA(n_components=2)
4、训练模型,并得到主成分变量。X_p= pca.fit(X).transform(X)print(X.shape)#原始变量维度print(X_p.shape)#主成分变量的维度由结果可知,原来的13维变量,现在降到了二维变量。
5、获取每个主成分的贡献度。print('各主成分贡献度:{}'.format(pca.explained_variance_ratio_))可以看到第一个主成分贡献度已经很高。
6、当多维变量降维后,就可以在二维坐标绘制出散点图了。plt.figure()plt.scatter(X_p[:, 0], X_p[:, 1], c=y,alpha=.8,label=target_names)plt.legend()plt.title('PCA of Wine')
声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。
阅读量:78
阅读量:67
阅读量:87
阅读量:56
阅读量:35