基于Python的XX餐馆满意度分析 基于Python的鲁菜 粤菜等满意度分析 K-means算法 nlp情感分析(新出)(爬虫携程)
from sklearn.cluster import KMeans
import pandas as pd
# 读取数据
data = pd.read_csv('data.csv')
# 特征缩放
from sklearn.preprocessing import MinMaxScaler
scaler = MinMaxScaler()
scaled_data = scaler.fit_transform(data)
# K-means聚类
kmeans = KMeans(n_clusters=3) # 假设我们要分成3个簇
kmeans.fit(scaled_data)
labels = kmeans.labels_
centroids = kmeans.cluster_centers_
# 将标签添加回原始数据
data['cluster'] = labels
# 输出聚类中心
print("Cluster Centroids:")
print(centroids)
# 可视化聚类结果
import matplotlib.pyplot as plt
# 定义颜色集合
colors = ['r', 'g', 'b']
# 绘制每个簇的点
for i in range(len(centroids)):
cluster_points = data[data['cluster'] == i]
plt.scatter(cluster_points['特征1'], cluster_points['特征2'], c=colors[i])
# 绘制簇的中心点
plt.scatter(centroids[:, 0], centroids[:, 1], marker='x', c='black')
plt.show()
这个代码实例展示了如何使用K-means算法对XX餐馆的满意度数据进行聚类分析。首先,我们读取数据并对其进行特征缩放。然后,我们使用KMeans类进行聚类,并输出聚类中心。最后,我们将聚类结果可视化,其中包括每个簇的点和簇的中心点。这个过程是数据挖掘和机器学习的一个常见应用,对于学习数据分析和机器学习的开发者来说,这是一个很好的实践。
评论已关闭