Python Pandas中使用merge函数进行数据合并
在Python的Pandas库中,merge
函数是一个强大的工具,可以用来合并两个或多个DataFrame对象的数据。以下是一个使用merge
函数的基本示例:
import pandas as pd
# 创建两个DataFrame
df1 = pd.DataFrame({'key': ['A', 'B', 'C', 'D'],
'value': [1, 2, 3, 5]})
df2 = pd.DataFrame({'key': ['B', 'D', 'D', 'E'],
'value': [4, 5, 6, 7]})
# 使用merge合并两个DataFrame
# 默认是内连接,只保留两个DataFrame都有的key
merged_df = pd.merge(df1, df2, on='key')
print(merged_df)
输出结果将是:
key value_x value_y
0 B 2 4
1 D 5 5
1 D 5 6
merge
函数的常用参数包括:
on
:用于合并的共同列或索引标签名称。how
:合并方式,可以是'left'、'right'、'outer'或'inner'。left_on
和right_on
:分别指定左右DataFrame的合并键。left_index
和right_index
:是否使用索引作为合并键。
你可以根据实际需求选择合适的参数进行数据合并。
评论已关闭