python下用pandas实现数据统计--groupby分组

2025-05-09 08:35:48

1、groupby广泛用在数据统计之中,可以实现很多数据库函数的功能。本文仅从单列分组,两列分组 , 求和 求平均 和 describe 时间分组还有筛选 ,六个方面例子进行说明。数据初始化代码:import pandas as pdimport numpy as npimport osimport sysexampleData = {'电源': ['220v', '110v', '28v', '5v', '3v'], '电阻': ['100', '100', '100', '1M', '2.2K'], '厂家': ['A厂', 'B厂', 'A厂', 'B厂', 'C厂' ], '数量': [5, 20, 14, 15, 20]}df = pd.DataFrame(exampleData)print(df)

python下用pandas实现数据统计--groupby分组

2、#按厂家分组,并统计个数print("------数据分组统计个数-----")groupnum = df.groupby(['厂家']).size()print(groupnum)#打印每组数据 这个很有用print("------数据分组-----")for groupname,grouplist in df.groupby('厂家'): print(groupname) print(grouplist)

python下用pandas实现数据统计--groupby分组

4、#追加列print("------追加列-----")df['地点'] = ['上海','北京',"大陆",'台湾','广州']df['日期'] = ['2019-03-11','2019-03-16',"2019-03-16",'2019-03-16','2019-03-15']print(df)print("------多 列 数据分组统计个数-----")groupnum = df.groupby(['厂家','电阻']).size()print(groupnum)

python下用pandas实现数据统计--groupby分组

6、print("------按厂家 分组,日期这一列count--")# 转化为时间格式df["新日期"] = pd.to_datetime(df["日期"],format ="%Y-%m-%d")print(df)groupcount = df.groupby([df['新日期']]).count()print(groupcount)groupnum = df.groupby(['新日期']).size()print(groupnum)# 按照年分组print(df.groupby(df["新日期"].apply(lambda i:i.year)).count())

python下用pandas实现数据统计--groupby分组
声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。
猜你喜欢