《Python数据分析与应用》第5章使用Pandas进行数据预处理 实训部分(源于大学课程python数据分析)

实训1合并线损、用电量趋势与线路告警数据

1.读取两表在这里插入图片描述在这里插入图片描述
2.查看两表形状
在这里插入图片描述
3.以ID和date两个键值作为主键进行内连接
在这里插入图片描述在这里插入图片描述
在这里插入图片描述
4.查看数据
在这里插入图片描述
在这里插入图片描述

实训2 插补用户电量数据缺失值

1.读取missing_data.csv表中的数据并将列名进行重命名操作
在这里插入图片描述
在这里插入图片描述
2.查询缺失值所在位置
在这里插入图片描述
3.使用SciPy库中interpolate模块中的lagrange对数据进行拉格朗日插值
data删除缺失值行后数据赋值给data2
在这里插入图片描述
生成x列表
在这里插入图片描述
分别提取data2中的数据放入y、y1、y2,之后分别与x进行拟合
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
用拟合函数填补缺失值(A用户缺失行为5,12;B用户缺失行为3.10,19,20;C用户缺失行为4,7,10,16。借此进行填充)

在这里插入图片描述
4.查看数据中是否存在缺失值,若不存在则说明插值成功
查看拉格朗日插值后缺失值的位置
在这里插入图片描述
查看每一列缺失值个数
在这里插入图片描述

实训3 标准化建模专家样本数据

1.读取model.csv数据
在这里插入图片描述
2.定义标准差标准化函数


3.使用函数分别对3列数据进行标准化;查看标准化后的数据

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

Logo

华为开发者空间,是为全球开发者打造的专属开发空间,汇聚了华为优质开发资源及工具,致力于让每一位开发者拥有一台云主机,基于华为根生态开发、创新。

更多推荐