数据准备

import pandas as pd

train = pd.read_csv(r"../input/titanic/train.csv")
train.head()

在这里插入图片描述
查看是否有有重复数据

1、train.duplicated() 用布尔值说明数据是否重复

在这里插入图片描述

2、train[train.duplicated()] 筛选并展示重复数据
因为没有,所以展示为空
在这里插入图片描述

3、train.duplicated().sum() 输出重复数据的数量
这里为0

4、如果有重复数据,使用函数 df.drop_duplicates() 删除重复数据


我太懒了,我不想造重复数据
等之后碰到了有重复数据的数据集,再来返工一下吧 😁

Logo

为开发者提供学习成长、分享交流、生态实践、资源工具等服务,帮助开发者快速成长。

更多推荐