《Python数据分析与应用》第4章Pandas统计分析(1) 实训部分(源于大学课程python数据分析)

实训1 读取并查看P2P网络贷款数据主表的基本信息

1.利用read_csv读取P2P网络贷款数据主表在这里插入图片描述
在这里插入图片描述
2.利用ndim属性查看主表维度、利用shape属性查看主表形状、利用memory_usage属性查看主表占用内存信息
在这里插入图片描述
3.利用describe方法对主表进行描述性统计分析
在这里插入图片描述
4.利用自定义函数剔除值相同或全为空的列,标准差表示的是样本数据的离散程度,标准差为0就是数组为空值,所以求全为空的列就是求标准差为0的列在这里插入图片描述

实训2 提取用户信息更新表和登录信息表的时间信息

1.利用read_csv读取用户信息更新表和登录信息表
在这里插入图片描述
2.利用to_datetime函数转换用户信息更新表和登录信息表的时间字符串
在这里插入图片描述
在这里插入图片描述
3.利用year、month、week等方法提取用户信息更新表和登录信息表中的时间信息

3.1提取用户信息更新表字段为’ListingInfo1’、‘UserupdateInfo2’中的时间信息
在这里插入图片描述
在这里插入图片描述
3.2提取登录信息表字段为’Listinginfo1’、'LogInfo3’中的时间信息
在这里插入图片描述
在这里插入图片描述
4.计算用户信息更新表和登录信息表中两时间的差,分别以日、小时、分钟计算
4.1计算用户信息更新表的两时间差
4.1.1以日计算
在这里插入图片描述
4.1.2以小时计算

在这里插入图片描述

4.1.3以分钟计算
在这里插入图片描述
4.2计算用户登录信息表的两时间差
4.2.1以日计算
在这里插入图片描述
4.2.2以小时计算
在这里插入图片描述
4.2.3以分钟计算
在这里插入图片描述

Logo

为开发者提供学习成长、分享交流、生态实践、资源工具等服务,帮助开发者快速成长。

更多推荐