Pandas DataFrame describe() 方法
定义和用法
describe()
方法返回 DataFrame 中数据的描述。
如果 DataFrame 包含数值数据,则每列的描述包含以下信息:
- count - 非空值的数量
- mean - 平均值
- std - 标准偏差
- min - 最小值
- 25% - 25%分位数 *
- 50% - 50%分位数 *
- 75% - 75%分位数 *
- max - 最大值
* 分位数的意义:有多少值小于给定的分位数。在我们的机器学习分位数章节中了解更多关于分位数的信息。
实例
返回 DataFrame 中数据的统计描述:
import pandas as pd data = [[10, 18, 11], [13, 15, 8], [9, 20, 3]] df = pd.DataFrame(data) print(df.describe())
语法
dataframe.describe(percentiles, include, exclude, datetime_is_numeric)
参数
percentile
, include
, exclude
, datetime_is_numeric
参数是关键字参数。
参数 | 值 | 描述 |
---|---|---|
percentile | 介于 0 和 1 之间的数字 |
可选。要包含在结果中的百分位数列表。 默认为:[.25, .50, .75]。 |
include |
|
可选。允许在结果中的数据类型列表。 |
exclude |
|
可选。不允许在结果中的数据类型列表。 |
datetime_is_numeric |
|
可选。设置为 True 以将日期时间数据视为数字。 默认为 False。 |
返回值
包含每行统计信息的 DataFrame 对象。