主成分分析法(PCA)的理解(附python代码案例)
主成分分析(PCA)是一种统计方法,它能够将原始数据转换为一组新的、互相无关的变量,这些变量称为主成分。新变量是原始变量的线性组合,且它们之间互不相关。PCA经常用于数据压缩和数据可视化,也可以用于去噪声和特征识别。
以下是一个使用Python进行PCA的简单例子:
from sklearn.decomposition import PCA
import numpy as np
# 创建一些用于演示的数据
data = np.array([[16, 9, 4, 11, 10, 6, 12, 7, 5],
[10, 2, 8, 1, 16, 7, 12, 5, 9],
[14, 6, 14, 12, 10, 8, 16, 4, 6],
[15, 7, 5, 14, 15, 10, 14, 6, 8]])
# 实例化PCA对象,选择要保留的主成分数量
pca = PCA(n_components=2) # 这里选择2个主成分
# 对数据进行PCA转换
pca.fit(data)
reduced_data = pca.transform(data)
# 打印主成分所占的方差百分比
print(pca.explained_variance_ratio_)
# 打印降维后的数据
print(reduced_data)
在这个例子中,我们首先创建了一个4x9的数据矩阵,然后实例化了一个PCA对象,并设置了要保留的主成分数量为2。接着,我们用PCA对象来拟合数据并进行转换,最后打印出降维后的数据以及各主成分所占的方差百分比。
评论已关闭