pandas合并DataFrame的进阶方法merge的使用详解

2026-04-25 05:59:36

1、首先，为了更好的展示merge的功能，创建两个具有代表性的DataFrame

如图，有key、key1、key2、a、b、c、d这样的数据列。

2、直接使用merge合并两个DataFrame,

res = pd.merge(left,right)

不加任何属性参数的情况下，默认是inner合并，即裁剪掉相互之间没有的数据

res = pd.merge(left,right,on='key')

当加上on属性的时候，是基于key列来合并，通过key的每一个值来查找左右两边的数据，组成新的DataFrame

pandas合并DataFrame的进阶方法merge的使用详解

3、当on传入多个key的时候，

res = pd.merge(left,right,on=['key1','key2'])

默认情况是基于同个key同时成立的左右两个的数据

res = pd.merge(left,right,on=['key1','key2'],how='left')

how=‘left’时左边的数据般过来，右边没有的用NaN填充

how=‘outer’时，列出了所有的key情况，同时填充左右两边都没有的数据

pandas合并DataFrame的进阶方法merge的使用详解

4、merge为了让人更好的观察理解，有两个很好用的属性，

suffixes：重命名两组数据相同的字段名称，默认在相同的名称后加上_x和_y，可以传入两个参数，自定义suffixes=['_k1','_k2']

indicator：默认情况是False，当为True或其他string的时候，会在生产一个新列说明，合并方式

pandas合并DataFrame的进阶方法merge的使用详解

声明：本网站引用、摘录或转载内容仅供网站访问者交流或参考，不代表本站立场，如存在版权或非法内容，请联系站长删除，联系邮箱：site.kefu@qq.com。