import pandas as pd
# 1. 读取Excel文件
df = pd.read_excel('example.xlsx')
# 2. 选择特定的列
selected_column = df['Column Name']
# 3. 选择特定的行
selected_rows = df[df['Column Name'] == 'Some Value']
# 4. 修改数据
df.loc[df['Column Name'] == 'Some Value', 'Column Name'] = 'New Value'
# 5. 添加新列
df['New Column'] = df['Column1'] + df['Column2']
# 6. 删除列
del df['Column Name']
# 7. 排序
df_sorted = df.sort_values(by='Column Name')
# 8. 去重
df_unique = df.drop_duplicates(subset=['Column1', 'Column2'])
# 9. 条件筛选
filtered_df = df[df['Column Name'].isin(['Value1', 'Value2'])]
# 10. 分组统计
grouped_df = df.groupby('Column Name').sum()
# 11. 合并数据帧
df_merged = pd.merge(df1, df2, on='Common Column')
# 12. 保存到Excel
df.to_excel('output.xlsx', index=False)
# 13. 数据的转置(对行列互换)
df_transposed = df.transpose()
# 14. 读取CSV文件并保存为Excel
csv_df = pd.read_csv('example.csv')
csv_df.to_excel('output.xlsx', index=False)
以上代码示例展示了如何使用Python的pandas库来处理Excel文件的常见操作,包括读取、选择列和行、修改数据、添加和删除列、排序、去重、条件筛选、分组统计、合并数据帧、保存数据以及转置数据。这些操作涵盖了日常数据分析的常用步骤,对于数据处理任务非常有用。