python:sklearn标签编码(LabelEncoder)

sklearn.preprocessing.LabelEncoder的使用

在训练模型之前,通常都要对数据进行一定得处理。将类别编号是一种常用的处理方法,比如把类别“电脑”,“手机”编号为0和1,可使用LabelEncoder函数。

作用
将n个类别编码为0~n-1之间的整数(包括0和n-1)

例子
假设对电子产品数据进行编码,数据可以分为两种情况:有NaN,无NaN

方法一:使用fit()函数及transform()函数

from sklearn import preprocessing

data=['电脑','手机','手机','手表']

enc=preprocessing.LabelEncoder()
enc=enc.fit(['电脑','手机','手表'])#训练LabelEncoder,将电脑,手表,手机编码为0,1,2
data=enc.transform(data)#使用训练好的LabelEncoder对原数据进行编码,也叫归一化

print(data)#[2 0 0 1]

方法二:使用fit_transform函数

from sklearn import preprocessing

data=['电脑','手机','手机','手表']

enc=preprocessing.LabelEncoder()
data=enc.fit_transform(data)#训练LabelEncoder,将电脑,手表,手机编码为0,1,2

print(data)#[2 0 0 1]

fit,transform,fit_transform区别连接

Logo

为开发者提供学习成长、分享交流、生态实践、资源工具等服务,帮助开发者快速成长。

更多推荐