Pandas DataFrame equals() 方法

定义和用法

duplicated() 方法比较两个 DataFrame,如果它们在形状和内容上都相等,则返回 True,否则返回 False。

使用 subset 参数指定比较时是否不应考虑任何列。

实例

检查两个 DataFrame 是否相等:

import pandas as pd

data1 = {
  "name": ["Sally", "Mary", "John", "Mary"],
  "age": [50, 40, 30, 40]
}
df1 = pd.DataFrame(data)

data2 = {
  "name": ["Sally", "Mary", "John", "Mary"],
  "age": [50, 40, 30, 40]
}
df2 = pd.DataFrame(data)

print(df1.equals(df2))

亲自试一试

语法

dataframe.duplicated(subset, keep)

参数

参数是关键字参数

参数 描述
subset 列标签 可选。字符串或列表,包含要忽略的任何列。
keep
  • 'first'
  • 'last'
  • False

可选。默认 'first'。指定要保留哪个副本。

如果为 False,则删除所有重复项。

返回值

布尔值,如果 DataFrame 相等则为 True,否则为 False。