【Python】详解pandas库中pd.merge函数与代码示例
import pandas as pd
# 创建示例数据框df1和df2
df1 = pd.DataFrame({'key': ['A', 'B', 'C', 'D'],
'value': [1, 2, 3, 4]})
df2 = pd.DataFrame({'key': ['B', 'D', 'D', 'E'],
'value': [5, 6, 7, 8]})
# 使用pd.merge合并df1和df2,按照'key'列进行左连接
merged_df = pd.merge(df1, df2, on='key', how='left')
print(merged_df)
这段代码首先导入pandas库,并创建两个示例数据框df1和df2。然后使用pd.merge函数按照'key'列将df1和df2合并成一个新的数据框merged\_df。这里的合并方式是左连接(how='left'),表示左边的df1(即第一个数据框)为主,df2中与df1的'key'列相匹配的行会被合并进merged\_df,而df1中不匹配的行会保持不变,并且df2中不匹配的行会被填充为缺失值(NaN)。最后打印出合并后的数据框merged\_df。
评论已关闭