Pandas DataFrame sample() 方法
定义和用法
sample()
方法返回指定数量的随机行。
如果未指定数字,sample()
方法将返回 1 行。
注意:除了样本行之外,还将返回列名。
实例
返回 DataFrame 的一行随机样本。
在此例中,我们使用名为 data.csv 的 .csv 文件。
import pandas as pd df = pd.read_csv('data.csv') print(df.sample())
语法
dataframe.sample(n, frac, replace, weights, random_state, axis)
参数
frac
、replace
、weights
、random_state
、axis
参数是关键字参数。
参数 | 值 | 描述 |
---|---|---|
n |
可选。要返回的行数。 默认值为 1。 |
|
frac | 浮点数 | 可选。要返回的行的一部分,例如 0.5 代表 50% 的行。 |
replace |
|
可选。指定是否允许多次返回同一行。 默认为 False。 |
weights |
|
可选。指定某些行或列的重要性。 默认为 'None'。 |
random_state |
|
可选。指定所使用的随机生成器的种子。 |
axis |
|
可选。要采样的轴。 默认为 0。 |
返回值
带有原始 DataFrame 样本的 DataFrame。