【数据处理系列】深入理解递归特征消除法(RFE):基于Python的应用
from sklearn.feature_selection import RFE
from sklearn.linear_model import LinearRegression
from sklearn.datasets import make_regression
# 生成一个回归数据集
X, y = make_regression(n_features=10, n_informative=5, random_state=0)
# 初始化LinearRegression模型
model = LinearRegression()
# 初始化RFE,设置特征数为5,使用交叉验证
rfe = RFE(model, n_features_to_select=5, step=1, verbose=1)
# 在数据集上训练RFE
rfe.fit(X, y)
# 输出被选中的特征
print(f"Selected features: {rfe.support_}")
# 输出特征的排名
print(f"Feature ranking: {rfe.ranking_}")
这段代码首先使用sklearn.datasets.make_regression
生成一个回归数据集,然后初始化一个LinearRegression
模型和一个RFE
特征选择对象。通过在数据集上训练RFE
,我们可以得到被选中的特征和它们的排名。这是一个基本的例子,展示了如何使用RFE
来进行特征选择。
评论已关闭