手抄报 安全手抄报 手抄报内容 手抄报图片 英语手抄报 清明节手抄报 节约用水手抄报

pandas教程:[11]aggregate分组计算

时间:2024-10-12 15:58:24

一旦对数据分组,接下来一定是对各组数据进行计算,这是通过groupby.aggregate()实现的,我们来看一下今天的例子:

先引入必要的模块,然后创建一个DataFrame对象,如果你看了前几篇文章,应该已经知道这个DataFrame了。

pandas教程:[11]aggregate分组计算
这是内部数据:
pandas教程:[11]aggregate分组计算

根据两个索引color、food进行分组

pandas教程:[11]aggregate分组计算

计算各组总和:

pandas教程:[11]aggregate分组计算
计算结果为:
pandas教程:[11]aggregate分组计算

计算结果默认使用了两个分组索引color和food作为新的DataFrame的索引(注意计算结果为一个DataFrame对象),可以使用reset_index()来将两个索引转化为列变量

pandas教程:[11]aggregate分组计算
结果为:
pandas教程:[11]aggregate分组计算

在分组是也可以使用as_index参数达到reset_index()的效果:

pandas教程:[11]aggregate分组计算
计算结果为:
pandas教程:[11]aggregate分组计算

另外我们经常用到的一个方法为size()返回各组数据量

pandas教程:[11]aggregate分组计算
结果为:
pandas教程:[11]aggregate分组计算

最后,还有一个经常用到的方法为describe(),对各组数据进行描述性统计:

pandas教程:[11]aggregate分组计算
计算结果为:
pandas教程:[11]aggregate分组计算

© 手抄报圈