【pandas】查找重复数据 df.duplicated() 、删除重复数据 df.drop_duplicates()
扒拉 重复数据, 删除重复数据
·
数据准备
import pandas as pd
train = pd.read_csv(r"../input/titanic/train.csv")
train.head()
查看是否有有重复数据
1、train.duplicated()
用布尔值说明数据是否重复
2、train[train.duplicated()]
筛选并展示重复数据
因为没有,所以展示为空
3、train.duplicated().sum()
输出重复数据的数量
这里为0
4、如果有重复数据,使用函数 df.drop_duplicates()
删除重复数据
我太懒了,我不想造重复数据
等之后碰到了有重复数据的数据集,再来返工一下吧 😁
更多推荐
已为社区贡献3条内容
所有评论(0)