python:sklearn标签编码(LabelEncoder)

sklearn.preprocessing.LabelEncoder的使用

在训练模型之前,通常都要对数据进行一定得处理。将类别编号是一种常用的处理方法,比如把类别“电脑”,“手机”编号为0和1,可使用LabelEncoder函数。

作用
将n个类别编码为0~n-1之间的整数(包括0和n-1)

例子
假设对电子产品数据进行编码,数据可以分为两种情况:有NaN,无NaN

方法一:使用fit()函数及transform()函数

from sklearn import preprocessing

data=['电脑','手机','手机','手表']

enc=preprocessing.LabelEncoder()
enc=enc.fit(['电脑','手机','手表'])#训练LabelEncoder,将电脑,手表,手机编码为0,1,2
data=enc.transform(data)#使用训练好的LabelEncoder对原数据进行编码,也叫归一化

print(data)#[2 0 0 1]

方法二:使用fit_transform函数

from sklearn import preprocessing

data=['电脑','手机','手机','手表']

enc=preprocessing.LabelEncoder()
data=enc.fit_transform(data)#训练LabelEncoder,将电脑,手表,手机编码为0,1,2

print(data)#[2 0 0 1]

fit,transform,fit_transform区别连接

Logo

华为开发者空间,是为全球开发者打造的专属开发空间,汇聚了华为优质开发资源及工具,致力于让每一位开发者拥有一台云主机,基于华为根生态开发、创新。

更多推荐