Pandas DataFrame groupby() 方法

定义和用法

groupby() 方法允许您对数据进行分组并对这些组执行函数。

实例

求每个汽车品牌的平均二氧化碳消耗量：

import pandas as pd

data = {
  'co2': [95, 90, 99, 104, 105, 94, 99, 104],
  'model': ['Citigo', 'Fabia', 'Fiesta', 'Rapid', 'Focus', 'Mondeo', 'Octavia', 'B-Max'],
  'car': ['Skoda', 'Skoda', 'Ford', 'Skoda', 'Ford', 'Ford', 'Skoda', 'Ford']
}

df = pd.DataFrame(data)

print(df.groupby(["car"]).mean())

亲自试一试

语法

dataframe.groupby(by, axis, level, as_index, sort, group_keys, observed, dropna)

参数

axis、level、as_index、sort、group_keys、observed、dropna 参数是关键字参数。

参数	值	描述
by		必需。标签、标签列表或用于指定如何对 DataFrame 进行分组的函数。
axis	0 1 'index' 'columns'	可选。按哪个轴进行分组。默认 0。
level	level None	可选。指定是否应按特定级别进行分组。默认为 None。
as_index	True False	可选。如果结果不应使用组标签作为索引，则设置为 False。默认 True。
sort	True False	可选。如果结果不应对组键进行排序（以提高性能），则设置为 False。默认 True。
group_keys	True False	可选。如果结果不应将组键添加到索引，则设置为 False。默认 True。
dropna	True False	可选。如果结果应包含组键为 NULL 值的行/列，则设置为 False。默认 True。

返回值

DataFrameGroupBy 对象，其中行/列已分组。