【pandas】查找重复数据 df.duplicated() 、删除重复数据 df.drop_duplicates()
扒拉 重复数据, 删除重复数据
·
数据准备
import pandas as pd
train = pd.read_csv(r"../input/titanic/train.csv")
train.head()

查看是否有有重复数据
1、train.duplicated() 用布尔值说明数据是否重复

2、train[train.duplicated()] 筛选并展示重复数据
因为没有,所以展示为空
3、train.duplicated().sum() 输出重复数据的数量
这里为0
4、如果有重复数据,使用函数 df.drop_duplicates() 删除重复数据
我太懒了,我不想造重复数据
等之后碰到了有重复数据的数据集,再来返工一下吧 😁
更多推荐



所有评论(0)