示例:

df = pd.DataFrame({
    '用户编号': ['小明', '小明', '小王', '小美', '小张', '小王'],
    '统计日期': ['11.12', '11.12', '11.12', '11.12', '11.13''11.13'],
    '消费金额': [4, 3, 5, 10, 2, 5]
})

在这里插入图片描述

可见用户 “小明”,在11.12当日产生的消费金额不一致,因此判断为异常数据,将其找出:

dup_row = df.duplicated(subset=['用户编号', '统计日期'], keep=False)
df.insert(0, 'is_dup', dup_row)
df[df['is_dup'] == True]

在这里插入图片描述

Logo

为开发者提供学习成长、分享交流、生态实践、资源工具等服务,帮助开发者快速成长。

更多推荐