【Python】Pandas Groupby操作的25个示例




import pandas as pd
 
# 示例数据
data = {
    'Team': ['Red', 'Blue', 'Red', 'Blue'],
    'Rank': [1, 2, 2, 1],
    'Year': [2014, 2015, 2016, 2017],
    'Points': [88, 86, 85, 87]
}
df = pd.DataFrame(data)
 
# 1. 按Team分组并计算每个Team的平均Points
grouped_data = df.groupby('Team')['Points'].mean()
print(grouped_data)
 
# 2. 按Team和Rank分组并计算每个组的Points总和
grouped_data = df.groupby(['Team', 'Rank'])['Points'].sum()
print(grouped_data)
 
# 3. 按Year分组并计算每个Year中的Points的平均值,并按平均值降序排序
grouped_data = df.groupby('Year')['Points'].mean().sort_values(ascending=False)
print(grouped_data)
 
# 4. 按Team分组,计算每个Team的Points的最大值,并按最大值降序排序
grouped_data = df.groupby('Team')['Points'].max().sort_values(ascending=False)
print(grouped_data)
 
# 5. 按Rank分组并计算每个Rank对应的Team的数量
grouped_data = df.groupby('Rank')['Team'].count()
print(grouped_data)
 
# 6. 按Year分组,计算每个Team的Points的总和,并按年份进行筛选,只保留2016年的数据
grouped_data = df.groupby('Year')['Points'].sum()
filtered_data = grouped_data[grouped_data.index == 2016]
print(filtered_data)
 
# 7. 按Team分组,计算每个Team在2016年获得的Points的总和
grouped_data = df[(df['Year'] == 2016)].groupby('Team')['Points'].sum()
print(grouped_data)
 
# 8. 按Team分组,计算每个Team在2014年和2016年获得的Points的总和,并按总和降序排序
grouped_data = df[df['Year'].isin([2014, 2016])].groupby('Team')['Points'].sum().sort_values(ascending=False)
print(grouped_data)
 
# 9. 按Team分组,计算每个Team在2014年和2016年获得的Points的总和,并筛选出总和大于170的Team
grouped_data = df[df['Year'].isin([2014, 2016])].groupby('Team')['Points'].sum()
filtered_data = grouped_data[grouped_data > 170]
print(filtered_data)
 
# 10. 按Team分组,计算每个Team在2014年和2016年获得的Points的总和,并按Rank降序排序
grouped_data = df[df['Year'].isin([2014, 2016])].groupby('Team')['Points'].sum()
sorted_data = grouped_data.sort_values(ascending=False)
print(sorted_data)
 
# 11. 按Team分组,计算每个Team在2014年和2016年获得的Points的总和,并按Rank降序排序,然后取前两名
top_teams = df[df['Year'].isin([2014, 2016])].groupby('Team')['Points'].sum().sort_values(ascending=False)[:2]
print(top_teams)
 
# 12. 按Team分组,计算每个Team的Points的总和,并按Year进行分组,然后计算
最后修改于:2024年08月13日 09:44

评论已关闭

推荐阅读

DDPG 模型解析,附Pytorch完整代码
2024年11月24日
DQN 模型解析,附Pytorch完整代码
2024年11月24日
AIGC实战——Transformer模型
2024年12月01日
Socket TCP 和 UDP 编程基础(Python)
2024年11月30日
python , tcp , udp
如何使用 ChatGPT 进行学术润色?你需要这些指令
2024年12月01日
AI
最新 Python 调用 OpenAi 详细教程实现问答、图像合成、图像理解、语音合成、语音识别(详细教程)
2024年11月24日
ChatGPT 和 DALL·E 2 配合生成故事绘本
2024年12月01日
omegaconf,一个超强的 Python 库!
2024年11月24日
【视觉AIGC识别】误差特征、人脸伪造检测、其他类型假图检测
2024年12月01日
[超级详细]如何在深度学习训练模型过程中使用 GPU 加速
2024年11月29日
Python 物理引擎pymunk最完整教程
2024年11月27日
MediaPipe 人体姿态与手指关键点检测教程
2024年11月27日
深入了解 Taipy:Python 打造 Web 应用的全面教程
2024年11月26日
基于Transformer的时间序列预测模型
2024年11月25日
Python在金融大数据分析中的AI应用(股价分析、量化交易)实战
2024年11月25日
AIGC Gradio系列学习教程之Components
2024年12月01日
Python3 `asyncio` — 异步 I/O,事件循环和并发工具
2024年11月30日
llama-factory SFT系列教程:大模型在自定义数据集 LoRA 训练与部署
2024年12月01日
Python 多线程和多进程用法
2024年11月24日
Python socket详解,全网最全教程
2024年11月27日