Python数据合并/拼接函数concat、append、merge、join
在Python中,pandas库提供了几个函数用于数据的合并和拼接,包括concat、append、merge和join。以下是每个函数的简单介绍和使用示例:
concat()
: 用于沿着一条轴将多个对象堆叠到一起。适用于简单的纵向或横向堆叠数据。
import pandas as pd
df1 = pd.DataFrame({'A': ['A0', 'A1'], 'B': ['B0', 'B1']})
df2 = pd.DataFrame({'A': ['A2', 'A3'], 'B': ['B2', 'B3']})
result = pd.concat([df1, df2], ignore_index=True)
append()
: 是concat()
的简化版,用于简单的DataFrame添加。
df1 = pd.DataFrame({'A': ['A0', 'A1'], 'B': ['B0', 'B1']})
df2 = pd.DataFrame({'A': ['A2', 'A3'], 'B': ['B2', 'B3']})
result = df1.append(df2, ignore_index=True)
merge()
: 用于按照指定的列或索引进行两个DataFrame的合并,类似SQL中的JOIN操作。
df1 = pd.DataFrame({'key': ['K0', 'K1'], 'A': ['A0', 'A1']})
df2 = pd.DataFrame({'key': ['K0', 'K1'], 'B': ['B0', 'B1']})
result = pd.merge(df1, df2, on='key')
join()
: 是merge()
的特例,用于按照索引合并两个DataFrame。
df1 = pd.DataFrame({'key': ['K0', 'K1'], 'A': ['A0', 'A1']})
df2 = pd.DataFrame({'key': ['K0', 'K1'], 'B': ['B0', 'B1']})
result = df1.join(df2)
以上每个函数都有不同的参数设置,可以控制合并的方式和行为。在实际应用中,需要根据数据的结构和需求选择合适的函数。
评论已关闭