如何利用Python进行主成分分析?
1、本文以sklearn中的wine数据集为例来说明主成分分析。首先下载数据集。
from sklearn import datasets
wine=datasets.load_wine()
X=wine.data
y=wine.target
target_names=wine.target_names

2、从机器学习包中导入主成分分析函数。
from sklearn.decomposition import PCA

3、建立主成分,这里设主成分个数为2个,即n_components=2,其他参数为默认值。
pca = PCA(n_components=2)

4、训练模型,并得到主成分变量。
X_p= pca.fit(X).transform(X)
print(X.shape)#原始变量维度
print(X_p.shape)#主成分变量的维度
由结果可知,原来的13维变量,现在降到了二维变量。

5、获取每个主成分的贡献度。
print('各主成分贡献度:{}'.format(pca.explained_variance_ratio_))
可以看到第一个主成分贡献度已经很高。

6、当多维变量降维后,就可以在二维坐标绘制出散点图了。
plt.figure()
plt.scatter(X_p[:, 0], X_p[:, 1], c=y,alpha=.8,label=target_names)
plt.legend()
plt.title('PCA of Wine')


声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。
                                阅读量:186
阅读量:109
阅读量:151
阅读量:90
阅读量:24