python-pandas数据分析+案例分析
import pandas as pd
# 读取CSV文件
df = pd.read_csv('data.csv')
# 数据清洗,假设需要处理的是字符串列,删除空格
df['列名'] = df['列名'].str.replace(' ', '')
# 数据筛选,选择满足条件的行
filtered_df = df[df['列名'] > 某个值]
# 数据汇总,按照某列分组并进行统计
summary = df.groupby('列名')['目标列'].agg({'统计量': 'sum'})
# 可视化数据,绘制柱状图
import matplotlib.pyplot as plt
summary.plot(kind='bar')
plt.show()
# 将处理后的数据保存到新的CSV文件
filtered_df.to_csv('new_data.csv', index=False)
这个简单的代码示例展示了如何使用pandas来处理数据,包括读取CSV文件,数据清洗,筛选,汇总,可视化以及输出处理后的数据到CSV文件。这个流程是数据分析的基础,可以根据实际需求进行功能扩展和复杂处理。
评论已关闭