import pandas as pd
data = {
"name": ["John", "Mary", "John", "Sally", "Mary"],
"age": [40, 30, 40, 50, 30],
"city": ["Bergen", "Oslo", "Stavanger", "Oslo", "Oslo"]
}
df = pd.DataFrame(data)
s = df.duplicated(subset=["name", "age"])
print(s)
# 这个示例仅比较 "name" 和 "age" 列,
# 第 2 行与第 0 行在 "name" 和 "age" 上完全相同,
# 第 4 行与第 1 行在 "name" 和 "age" 上完全相同,