【python】pandas:DataFrame合并技巧详解
在Pandas中,可以使用多种方法来合并DataFrame,常用的有merge
, join
, concat
等。以下是每种方法的简单示例:
merge
: 类似于SQL中的JOIN操作,可以根据一个或多个键将行合并起来。
import pandas as pd
df1 = pd.DataFrame({'key': ['A', 'B', 'C', 'D'],
'value': [1, 2, 3, 5]})
df2 = pd.DataFrame({'key': ['B', 'D', 'D', 'E'],
'value': [4, 5, 6, 7]})
result = pd.merge(df1, df2, on='key') # 默认inner连接
join
: 基于index进行合并,类似于SQL中的UNION操作。
df1 = df1.set_index('key')
df2 = df2.set_index('key')
result = df1.join(df2, lsuffix='_left', rsuffix='_right') # 默认按index合并
concat
: 沿着一条轴将多个DataFrame或Series拼接起来。
result = pd.concat([df1, df2], axis=0) # 按行合并
# 或者按列合并
result = pd.concat([df1, df2], axis=1)
根据实际需求选择合适的合并方法。
评论已关闭