如何利用Python进行主成分分析?

2025-11-01 00:33:25

1、本文以sklearn中的wine数据集为例来说明主成分分析。首先下载数据集。

from sklearn import datasets

wine=datasets.load_wine()

X=wine.data

y=wine.target

target_names=wine.target_names

如何利用Python进行主成分分析?

2、从机器学习包中导入主成分分析函数。

from sklearn.decomposition import PCA

如何利用Python进行主成分分析?

3、建立主成分,这里设主成分个数为2个,即n_components=2,其他参数为默认值。

pca = PCA(n_components=2)

如何利用Python进行主成分分析?

4、训练模型,并得到主成分变量。

X_p= pca.fit(X).transform(X)

print(X.shape)#原始变量维度

print(X_p.shape)#主成分变量的维度

由结果可知,原来的13维变量,现在降到了二维变量。

如何利用Python进行主成分分析?

5、获取每个主成分的贡献度。

print('各主成分贡献度:{}'.format(pca.explained_variance_ratio_))

可以看到第一个主成分贡献度已经很高。

如何利用Python进行主成分分析?

6、当多维变量降维后,就可以在二维坐标绘制出散点图了。

plt.figure()

plt.scatter(X_p[:, 0], X_p[:, 1], c=y,alpha=.8,label=target_names)

plt.legend()

plt.title('PCA of Wine')

如何利用Python进行主成分分析?

如何利用Python进行主成分分析?

声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。
猜你喜欢