在使用pandas读入数据后,在预处理的过程中经常会需要删除多余无关的列数据

第一步,导入相关库

import numpy as np
import pandas as pd

第二步,读入数据,获取数据信息

path=r'路径\文件名'
data=pd.read_csv(path)
data.info()

获取数据信息非常重要,一是需要随时掌握处理后的数据情况,二是获得列数据的索引。

 第三步,找到需要删除的列名,并对应索引。例如需要删除“课程名称”,“课程ID”和“教学班ID”,对应索引为2-4。

第四步,使用list获取列名,使用索引获取需要删除的列

list(data)[2:5]

第五步,嵌套入drop函数,删除对应的列

datanor=data.drop(list(data)[2:5],axis=1)

axis=1表示对列进行操作

整个代码非常简单,适合删除多列的操作。

如果只需要删除单列,则可直接用列名取代第四步的代码。

Logo

华为开发者空间,是为全球开发者打造的专属开发空间,汇聚了华为优质开发资源及工具,致力于让每一位开发者拥有一台云主机,基于华为根生态开发、创新。

更多推荐