python——机器学习:sklearn模型选择model_selection模块函数说明和应用示例
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier
from sklearn.datasets import load_iris
import numpy as np
# 加载鸢尾花数据集
iris = load_iris()
X = iris.data
y = iris.target
# 使用train_test_split分割数据集为训练集和测试集
# 测试集大小为20%
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 创建KNN分类器实例
knn = KNeighborsClassifier(n_neighbors=5)
# 使用训练数据训练模型
knn.fit(X_train, y_train)
# 在测试集上评估模型性能
y_pred = knn.predict(X_test)
print(np.mean(y_pred == y_test)) # 打印模型在测试集上的准确性
这段代码首先导入了必要的模块,加载了鸢尾花数据集,并使用train_test_split
函数将数据分为训练集和测试集。接着创建了KNN分类器的实例,用训练集数据训练模型,最后在测试集上评估模型性能,并打印出模型的准确性。这个过程是机器学习项目中的标准步骤,对于理解如何使用sklearn进行模型选择和评估非常有帮助。
评论已关闭