Pandas DataFrame groupby() 方法
定义和用法
groupby()
方法允许您对数据进行分组并对这些组执行函数。
实例
求每个汽车品牌的平均二氧化碳消耗量:
import pandas as pd data = { 'co2': [95, 90, 99, 104, 105, 94, 99, 104], 'model': ['Citigo', 'Fabia', 'Fiesta', 'Rapid', 'Focus', 'Mondeo', 'Octavia', 'B-Max'], 'car': ['Skoda', 'Skoda', 'Ford', 'Skoda', 'Ford', 'Ford', 'Skoda', 'Ford'] } df = pd.DataFrame(data) print(df.groupby(["car"]).mean())
语法
dataframe.groupby(by, axis, level, as_index, sort, group_keys, observed, dropna)
参数
axis
、level
、as_index
、sort
、group_keys
、observed
、dropna
参数是关键字参数。
参数 | 值 | 描述 |
---|---|---|
by | 必需。标签、标签列表或用于指定如何对 DataFrame 进行分组的函数。 | |
axis |
|
可选。按哪个轴进行分组。 默认 0。 |
level |
|
可选。指定是否应按特定级别进行分组。 默认为 None。 |
as_index |
|
可选。如果结果不应使用组标签作为索引,则设置为 False。 默认 True。 |
sort |
|
可选。如果结果不应对组键进行排序(以提高性能),则设置为 False。 默认 True。 |
group_keys |
|
可选。如果结果不应将组键添加到索引,则设置为 False。 默认 True。 |
dropna |
|
可选。如果结果应包含组键为 NULL 值的行/列,则设置为 False。 默认 True。 |
返回值
DataFrameGroupBy 对象,其中行/列已分组。