Pandas DataFrame describe() 方法

定义和用法

describe() 方法返回 DataFrame 中数据的描述。

如果 DataFrame 包含数值数据,则每列的描述包含以下信息:

  • count - 非空值的数量
  • mean - 平均值
  • std - 标准偏差
  • min - 最小值
  • 25% - 25%分位数 *
  • 50% - 50%分位数 *
  • 75% - 75%分位数 *
  • max - 最大值

* 分位数的意义:有多少值小于给定的分位数。在我们的机器学习分位数章节中了解更多关于分位数的信息。

实例

返回 DataFrame 中数据的统计描述:

import pandas as pd

data = [[10, 18, 11], [13, 15, 8], [9, 20, 3]]

df = pd.DataFrame(data)

print(df.describe())

亲自试一试

语法

dataframe.describe(percentiles, include, exclude, datetime_is_numeric)

参数

percentile, include, exclude, datetime_is_numeric 参数是关键字参数

参数 描述
percentile 介于 0 和 1 之间的数字

可选。要包含在结果中的百分位数列表。

默认为:[.25, .50, .75]。

include
  • None
  • 'all'
  • 数据类型
可选。允许在结果中的数据类型列表。
exclude
  • None
  • 'all'
  • 数据类型
可选。不允许在结果中的数据类型列表。
datetime_is_numeric
  • True
  • False

可选。设置为 True 以将日期时间数据视为数字。

默认为 False。

返回值

包含每行统计信息的 DataFrame 对象。