在使用pandas读入数据后,在预处理的过程中经常会需要删除多余无关的列数据

第一步,导入相关库

import numpy as np
import pandas as pd

第二步,读入数据,获取数据信息

path=r'路径\文件名'
data=pd.read_csv(path)
data.info()

获取数据信息非常重要,一是需要随时掌握处理后的数据情况,二是获得列数据的索引。

 第三步,找到需要删除的列名,并对应索引。例如需要删除“课程名称”,“课程ID”和“教学班ID”,对应索引为2-4。

第四步,使用list获取列名,使用索引获取需要删除的列

list(data)[2:5]

第五步,嵌套入drop函数,删除对应的列

datanor=data.drop(list(data)[2:5],axis=1)

axis=1表示对列进行操作

整个代码非常简单,适合删除多列的操作。

如果只需要删除单列,则可直接用列名取代第四步的代码。

Logo

为开发者提供学习成长、分享交流、生态实践、资源工具等服务,帮助开发者快速成长。

更多推荐