Pandas DataFrame equals() 方法
定义和用法
duplicated()
方法比较两个 DataFrame,如果它们在形状和内容上都相等,则返回 True,否则返回 False。
使用 subset
参数指定比较时是否不应考虑任何列。
实例
检查两个 DataFrame 是否相等:
import pandas as pd data1 = { "name": ["Sally", "Mary", "John", "Mary"], "age": [50, 40, 30, 40] } df1 = pd.DataFrame(data) data2 = { "name": ["Sally", "Mary", "John", "Mary"], "age": [50, 40, 30, 40] } df2 = pd.DataFrame(data) print(df1.equals(df2))
语法
dataframe.duplicated(subset, keep)
参数
参数是关键字参数。
参数 | 值 | 描述 |
---|---|---|
subset | 列标签 | 可选。字符串或列表,包含要忽略的任何列。 |
keep |
|
可选。默认 'first'。指定要保留哪个副本。 如果为 False,则删除所有重复项。 |
返回值
布尔值,如果 DataFrame 相等则为 True,否则为 False。