pandas的基础知识(3)

2025-05-25 05:38:21

1、加载numpy和pandas,pandas中的DataFrame,Series。使用数组生成一个5*5的DataFrame,分别使用'Name','Salary','Age','Sex','flag'作为索引,赋值给df1;df2=df1.T表示将df1转置后赋值为df2;type(df2)查看df2的类型;如图所示

pandas的基础知识(3)

2、由DataFrame的一列生成Series。df2['Salary']表示取df2的一列;type(df2['Salary'])表示查看df2['Salary']的类型(显示为Series);如图所示

pandas的基础知识(3)

3、Series的绘图。加载matplotlib.pyplot绘图库;df2职邗珩垃['Salary'].plot(style='b',lw=2,title='Salary Plot',ylim=(0,20000))表示对Series进行绘图,style='b'表示用蓝色,lw=2表示线宽为2,title='Salary Plot'表示图形标题为'Salary Plot',ylim=(0,20000)表示Y轴的范围;plt.ylabel('Salary')表示给Y轴添加标签;如图所示

pandas的基础知识(3)

4、DataFrame的groupby操作(单稍僚敉视个字段分组)。df2.Salary=df2.Salary.astype(float)表示将df2的字段Salary转化为float;group1=df2.groupby(['Sex'])['Salary']表示df2按照'Sex'分组后对'Salary'字段进行统计;group1.mean()、group1.max()、group1.size()分别表示按‘Sex’分组后每组‘Salary’的均值、最大值、个数;如图所示

pandas的基础知识(3)

5、DataFrame的groupby操作(多稍僚敉视个字段分组)。group2=df2.groupby(['Sex','flag'])['Salary&垆杪屑丝#39;]表示df2按照'Sex'和'flag'分组后,对‘Salary’进行统计;group2.sum()和group2.size()分别表示按'Sex'、'flag'分组后每组的薪水总和、每组的个数;(group2.size()和group2.count()效果一样的)如图所示

pandas的基础知识(3)
声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。
猜你喜欢