Pandas DataFrame sample() 方法

定义和用法

sample() 方法返回指定数量的随机行。

如果未指定数字,sample() 方法将返回 1 行。

注意:除了样本行之外,还将返回列名。

实例

返回 DataFrame 的一行随机样本。

在此例中,我们使用名为 data.csv 的 .csv 文件。

import pandas as pd

df = pd.read_csv('data.csv')

print(df.sample())

亲自试一试

语法

dataframe.sample(n, frac, replace, weights, random_state, axis)

参数

fracreplaceweightsrandom_stateaxis 参数是关键字参数

参数 描述
n

可选。要返回的行数。

默认值为 1。

frac 浮点数 可选。要返回的行的一部分,例如 0.5 代表 50% 的行。
replace
  • True
  • False

可选。指定是否允许多次返回同一行。

默认为 False。

weights
  • 字符串
  • 列表

可选。指定某些行或列的重要性。

默认为 'None'。

random_state
  • 数字
  • 列表
可选。指定所使用的随机生成器的种子。
axis
  • 0
  • 1
  • 'index'
  • 'columns'

可选。要采样的轴。

默认为 0。

返回值

带有原始 DataFrame 样本的 DataFrame