admin 管理员组

文章数量: 887021


2024年2月18日发(作者:linux工作常用命令脚本)

groupby python用法

groupby是pandas库中的一个函数,用于按指定列的值对数据进行分组。它常与其他聚合函数(如sum、count、mean等)一起使用,用于对分组后的数据进行统计分析。

groupby函数的基本语法如下:

```python

y(by=列名)[需要统计的列名].聚合函数()

```

其中,by参数指定按哪一列进行分组,[需要统计的列名]指定对哪一列进行统计,聚合函数可以是sum、count、mean等等。

除了以上基本用法,groupby还可以进行更多的拓展应用:

1.多列分组:可以按多个列的值进行分组,只需将多个列名放入by参数中即可。

```python

y(by=[列1,列2])[需要统计的列].聚合函数()

```

2.应用多个聚合函数:可以对分组后的数据同时应用多个聚合函数,只需使用agg()函数,并在其中传入多个聚合函数。

```python

y(by=列名)[需要统计的列名].agg([聚合函数1,聚合函数2, ...])

```

3.自定义聚合函数:可以自定义自己的聚合函数,并在agg()函数中进行调用。

```python

def自定义函数名(x):

#自定义的聚合函数逻辑

return结果

y(by=列名)[需要统计的列名].agg(自定义函数名)

```

4.聚合结果应用回原始数据:可以将聚合结果应用回原始数据中,添加一个新列来存储聚合结果。

```python

y(by=列名)[需要统计的列名].transform(聚合函数)

```

通过上述拓展用法,可以更灵活地对数据进行分组和统计分析。


本文标签: 函数 聚合 列名 进行