[Python] 机器学习 - 常用数据集(Dataset)之鸢尾花(Iris)数据集介绍,数据可视化和使用案例
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.datasets import load_iris
# 加载鸢尾花数据集
iris = load_iris()
df = pd.DataFrame(iris.data, columns=iris.feature_names)
# 为不同种类的鸢尾花设置不同的颜色
colors = {
'setosa': 'red',
'versicolor': 'green',
'virginica': 'blue'
}
# 绘制鸢尾花的散点图,按种类颜色不同
def plot_iris(data, label):
for iris_type in label.unique():
rows = label == iris_type
plt.scatter(data[rows, 0], data[rows, 1], color=colors[iris_type])
plt.xlabel(iris.feature_names[0])
plt.ylabel(iris.feature_names[1])
plt.legend(label.unique())
plt.show()
# 调用函数绘制鸢尾花散点图
plot_iris(df.values, df[iris.target_names[0]])
这段代码首先加载了鸢尾花数据集,并使用Pandas创建了一个DataFrame。然后定义了一个颜色字典,用于指定不同种类鸢尾花的颜色。plot_iris
函数接受数据和标签作为输入,并绘制了一个散点图,其中不同种类的鸢尾花用不同颜色区分开来。最后调用函数并展示图表。这个例子展示了如何使用Python进行数据可视化,特别适合于机器学习中的数据探索。
评论已关闭