Pandas DataFrame 参考手册

以下是 DataFrame 对象的所有属性和方法,附有解释和实例:

属性/方法 描述
abs() 返回 DataFrame,其中包含每个值的绝对值。
add() 将 DataFrame 的值与指定的值相加。
add_prefix() 为所有标签添加前缀。
add_suffix() 为所有标签添加后缀。
agg() 对 DataFrame 的一个轴应用函数或函数名。
aggregate() 对 DataFrame 的一个轴应用函数或函数名。
align() 使用指定的连接方法对齐两个 DataFrame。
all() 如果 DataFrame 中的所有值都为 True,则返回 True,否则返回 False。
any() 如果 DataFrame 中的任意值为 True,则返回 True,否则返回 False。
append() 追加新列。
apply() 对 DataFrame 的一个轴应用函数。
applymap() 对 DataFrame 中的每个元素执行函数。
assign() 分配新列。
astype() 将 DataFrame 转换为指定的 dtype。
at 获取或设置具有指定标签的项目的值。
axes 返回 DataFrame 的行和列的标签。
bfill() 使用下一行的值替换 NULL 值。
bool() 返回 DataFrame 的布尔值。
columns 返回 DataFrame 的列标签。
combine() 比较两个 DataFrame 中的值,并让函数决定保留哪些值。
combine_first()

比较两个 DataFrame。

如果第一个 DataFrame 有 NULL 值,则使用第二个 DataFrame 中的相应值填充。

compare() 比较两个 DataFrame 并返回差值。
convert_dtypes() 将 DataFrame 中的列转换为新的 dtypes。
copy() 返回 DataFrame 的副本。
corr() 找出每列之间的相关性(关系)。
count() 返回每列/行的非空单元格数量。
cov() 求列的协方差。
cummax() 计算 DataFrame 的累积最大值。
cummin() 计算 DataFrame 的累积最小值。
cumprod() 计算 DataFrame 上的累积乘积。
cumsum() 计算 DataFrame 上的累积和。
describe() 返回 DataFrame 中每列的描述摘要。
diff() 计算值与上一行中相同列的值之间的差值。
div() 将 DataFrame 的值除以指定值。
dot() 将 DataFrame 的值与另一个类似数组的对象中的值相乘,并将结果相加。
drop() 从 DataFrame 中删除指定的行/列。
drop_duplicates() 从 DataFrame 中删除重复值。
droplevel() 删除指定的索引/列。
dropna() 删除所有包含 NULL 值的行。
dtypes 返回 DataFrame 列的 dtypes。
duplicated() 对于重复行返回 True,否则返回 False。
empty 如果 DataFrame 为空则返回 True,否则返回 False。
eq() 对于等于指定值的值返回 True,否则返回 False。
equals() 如果两个 DataFrame 相等,则返回 True,否则返回 False。
eval 评估指定的字符串。
explode() 将每个元素转换为行。
ffill() 使用上一行的值替换 NULL 值。
fillna() 使用指定的值替换 NULL 值。
filter() 根据指定的过滤器过滤 DataFrame。
first() 返回指定日期选择的第一行。
floordiv() 将 DataFrame 的值除以指定的值,并将值向下取整。
ge() 对于大于或等于指定值的值返回 True,否则返回 False。
get() 返回指定键的项目。
groupby() 将行/列分组到指定的组中。
gt() 对于大于指定值的值返回 True,否则返回 False。
head() 返回标题行和前 10 行,或指定数量的行。
iat 获取或设置指定位置项的值。
idxmax() 返回指定轴上最大值的标签。
idxmin() 返回指定轴上最小值的标签。
iloc 获取或设置指定位置的一组元素的值。
index 返回 DataFrame 的行标签。
infer_objects() 更改 DataFrame 中列的 dtype。
info() 打印有关 DataFrame 的信息。
insert() 在 DataFrame 中插入列。
interpolate() 用插值方法替换非数字值。
isin() 如果 DataFrame 中的每个元素都在指定值中,则返回 True。
isna() 查找非数字值。
isnull() 查找 NULL 值。
items() 遍历 DataFrame 的列。
iteritems() 遍历 DataFrame 的列。
iterrows() 遍历 DataFrame 的行。
itertuples() 将行作为命名元组进行迭代。
join() 连接另一个 DataFrame 的列。
keys() 返回信息轴的键。
kurtosis() 返回指定轴上值的峰度。
last() 返回指定日期选择的最后几行。
le() 对于小于或等于指定值的值返回 True,否则返回 False。
loc 获取或设置使用其标签指定的一组元素的值。
lt() 对于小于指定值的值返回 True,否则返回 False。
mask() 替换满足指定条件的所有值。
max() 返回指定轴上值的最大值。
mean() 返回指定轴上值的平均值。
median() 返回指定轴上值的中位数。
melt() 将 DataFrame 从宽表重塑为长表。
memory_usage() 返回每列的内存使用情况。
merge() 合并 DataFrame 对象。
min() 返回指定轴上值的最小值。
mod() 对 DataFrame 的值求模(取余数)。
mode() 返回指定轴上值的众数。
mul() 将 DataFrame 的值与指定的值相乘。
ndim 返回 DataFrame 的维度数。
ne() 对于不等于指定值的值返回 True,否则返回 False。
nlargest() 按指定列降序排序 DataFrame,并返回指定数量的行。
notna() 查找不是非数字的值。
notnull() 查找不是 NULL 的值。
nsmallest() 按指定列升序排序 DataFrame,并返回指定数量的行。
nunique() 返回指定轴上唯一值的数量。
pct_change() 返回当前值与前一个值之间的百分比变化。
pipe() 对 DataFrame 应用函数。
pivot() 重塑 DataFrame。
pivot_table() 创建电子表格数据透视表作为 DataFrame。
pop() 从 DataFrame 中移除一个元素。
pow() 将一个 DataFrame 的值提升到另一个 DataFrame 的值的幂。
prod() 返回指定轴上所有值的乘积。
product() 返回指定轴上值的乘积。
quantile() 返回指定轴上指定分位数的值。
query() 查询 DataFrame。
radd() 将一个 DataFrame 的值与另一个 DataFrame 的值反向相加。
rdiv() 将一个 DataFrame 的值与另一个 DataFrame 的值进行反向相除。
reindex() 更改 DataFrame 的标签。
reindex_like()
rename() 更改轴的标签。
rename_axis() 更改轴的名称。
reorder_levels() 重新排序索引级别。
replace() 替换指定的值。
reset_index() 重置索引。
rfloordiv() 反向将一个 DataFrame 的值除以另一个 DataFrame 的值(向下取整)。
rmod() 反向将一个 DataFrame 的值对另一个 DataFrame 的值求模。
rmul() 将一个 DataFrame 的值与另一个 DataFrame 的值反向相乘。
round() 返回所有值都四舍五入到指定格式后的 DataFrame。
rpow() 反向将一个 DataFrame 的值提升到另一个 DataFrame 的值的幂。
rsub() 反向将一个 DataFrame 的值减去另一个 DataFrame 的值。
rtruediv() 反向将一个 DataFrame 的值除以另一个 DataFrame 的值。
sample() 返回随机选择的元素。
select_dtypes() 返回包含选定数据类型的列的 DataFrame。
sem() 返回指定轴上平均值的标准误差。
set_axis() 设置指定轴的索引。
set_flags() 返回具有指定标志的新 DataFrame。
set_index() 设置 DataFrame 的索引。
shape 返回 DataFrame 的行数和列数。
size 返回 DataFrame 中的元素数量。
skew() 返回指定轴上值的偏度。
sort_index() 根据标签对 DataFrame 进行排序。
sort_values() 根据值对 DataFrame 进行排序。
squeeze() 将单列 DataFrame 转换为 Series。
stack() 将 DataFrame 从宽表重塑为长表。
std() 返回指定轴上值的标准差。
sub() 将 DataFrame 的值减去指定的值。
sum() 回指定轴上值的总和。
swaplevel() 交换两个指定的级别。
T 将行变成列,将列变成行。
tail() 返回表头和最后几行。
take() 返回指定的元素。
to_xarray() 返回 xarray 对象。
transform() 对 DataFrame 中的每个值执行函数。
transpose() 将行变成列,将列变成行。
truediv() 将 DataFrame 的值除以指定值。
truncate() 移除指定值集之外的元素。
update() 使用另一个 DataFrame 中的值更新一个 DataFrame。
value_counts() 返回唯一行的数量。
values 以 NumPy 数组形式返回 DataFrame。
var() 返回指定轴上值的方差。
where() 替换不满足指定条件的所有值。
xs() 返回 DataFrame 的横截面。
__iter__() 返回信息轴的迭代器。