pandas合并DataFrame的进阶方法merge的使用详解
1、首先,为了更好的展示merge的功能,创建两个具有代表性的DataFrame
如图,有key、key1、key2、a、b、c、d这样的数据列。

2、直接使用merge合并两个DataFrame,
res = pd.merge(left,right)
不加任何属性参数的情况下,默认是inner合并,即裁剪掉相互之间没有的数据
res = pd.merge(left,right,on='key')
当加上on属性的时候,是基于key列来合并,通过key的每一个值来查找左右两边的数据,组成新的DataFrame


3、当on传入多个key的时候,
res = pd.merge(left,right,on=['key1','key2'])
默认情况是基于同个key同时成立的左右两个的数据
res = pd.merge(left,right,on=['key1','key2'],how='left')
how=‘left’时左边的数据般过来,右边没有的用NaN填充
how=‘outer’时,列出了所有的key情况,同时填充左右两边都没有的数据


4、merge为了让人更好的观察理解,有两个很好用的属性,
suffixes:重命名两组数据相同的字段名称,默认在相同的名称后加上_x和_y,可以传入两个参数,自定义suffixes=['_k1','_k2']
indicator:默认情况是False,当为True或其他string的时候,会在生产一个新列说明,合并方式

声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。
阅读量:78
阅读量:25
阅读量:115
阅读量:105
阅读量:185