Pandas DataFrame groupby() 方法

定义和用法

groupby() 方法允许您对数据进行分组并对这些组执行函数。

实例

求每个汽车品牌的平均二氧化碳消耗量:

import pandas as pd

data = {
  'co2': [95, 90, 99, 104, 105, 94, 99, 104],
  'model': ['Citigo', 'Fabia', 'Fiesta', 'Rapid', 'Focus', 'Mondeo', 'Octavia', 'B-Max'],
  'car': ['Skoda', 'Skoda', 'Ford', 'Skoda', 'Ford', 'Ford', 'Skoda', 'Ford']
}

df = pd.DataFrame(data)

print(df.groupby(["car"]).mean())

亲自试一试

语法

dataframe.groupby(by, axis, level, as_index, sort, group_keys, observed, dropna)

参数

axislevelas_indexsortgroup_keysobserveddropna 参数是关键字参数

参数 描述
by 必需。标签、标签列表或用于指定如何对 DataFrame 进行分组的函数。
axis
  • 0
  • 1
  • 'index'
  • 'columns'

可选。按哪个轴进行分组。

默认 0。

level
  • level
  • None

可选。指定是否应按特定级别进行分组。

默认为 None。

as_index
  • True
  • False

可选。如果结果不应使用组标签作为索引,则设置为 False。

默认 True。

sort
  • True
  • False

可选。如果结果不应对组键进行排序(以提高性能),则设置为 False。

默认 True。

group_keys
  • True
  • False

可选。如果结果不应将组键添加到索引,则设置为 False。

默认 True。

dropna
  • True
  • False

可选。如果结果应包含组键为 NULL 值的行/列,则设置为 False。

默认 True。

返回值

DataFrameGroupBy 对象,其中行/列已分组。