pandas教程:[10]groupby选择列和迭代
groupby对象可以按照列选择数据,这种做法可以减少运算量,提高运算速度。而这里讲的迭代就是对各个组进行迭代以便对各个组进行不同的操作,因为进行相同的操作不必使用迭代。
引入相关模块
![pandas教程:[10]groupby选择列和迭代](https://exp-picture.cdn.bcebos.com/a749bb0f94fc508cd3da164b01775ddd894cfdab.jpg)
创建一个DataFrame对象,有两个index和两个column
![pandas教程:[10]groupby选择列和迭代](https://exp-picture.cdn.bcebos.com/3201a8f39187031cced47e4f6a86242fa972ecab.jpg)
打印一下,看看DataFrame到底有哪些内容
![pandas教程:[10]groupby选择列和迭代](https://exp-picture.cdn.bcebos.com/fab31cb375d7997bd7e00bebf9dade49600fd9ab.jpg)
以color index进行分类,然后选择a列数据,分组计算a列数据的总数
![pandas教程:[10]groupby选择列和迭代](https://exp-picture.cdn.bcebos.com/3fe32442a07aa01039273d8bbfbb19efa35f3ea8.jpg)
![pandas教程:[10]groupby选择列和迭代](https://exp-picture.cdn.bcebos.com/35f2224133bad34194693084427622bc7cc52ca8.jpg)
假如我们不选择a列,直接计算总数,可以得到。如果我们不需要b列的数据,那么显然事先选择a列进行计算可以减少无效的运算
![pandas教程:[10]groupby选择列和迭代](https://exp-picture.cdn.bcebos.com/c3c22dbf3bef354ffaac658d23db574afb321ba8.jpg)
![pandas教程:[10]groupby选择列和迭代](https://exp-picture.cdn.bcebos.com/a1780d1fceecd3d9d261237767995943050108a8.jpg)
迭代输出各个组的数据:
![pandas教程:[10]groupby选择列和迭代](https://exp-picture.cdn.bcebos.com/486884883913e8e524fa7c0f352f477047187da8.jpg)
![pandas教程:[10]groupby选择列和迭代](https://exp-picture.cdn.bcebos.com/04201aa355e983ae34c3889968efe078153169a8.jpg)
假如分类索引有两个,分别是color和food
![pandas教程:[10]groupby选择列和迭代](https://exp-picture.cdn.bcebos.com/46a92de039723d0355feef35bb486143d6d457a8.jpg)
![pandas教程:[10]groupby选择列和迭代](https://exp-picture.cdn.bcebos.com/65390a23beb9763e32d76a656ad06de89b61b0a8.jpg)
致力于数据分析的同行,欢迎与我联系交流
声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。
阅读量:153
阅读量:194
阅读量:170
阅读量:49
阅读量:172