import pandas as pd
data = {
"name": ["John", "Mary", "John", "Sally", "Mary"],
"age": [40, 30, 40, 50, 30],
"city": ["Bergen", "Oslo", "Stavanger", "Oslo", "Oslo"]
}
df = pd.DataFrame(data)
s = df.duplicated(keep=False)
print(s)
# 当 keep 参数设为 False 时,重复行的首次出现也会被标记为 True。
# 第 1 行返回 True,因为它与第 4 行完全相同。
# 第 4 行返回 True,因为它与第 1 行完全相同。