python:sklearn标签编码(LabelEncoder)

python:sklearn标签编码(LabelEncoder)sklearn.preprocessing.LabelEncoder的使用：在训练模型之前，通常都要对数据进行一定得处理。将类别编号是一种常用的处理方法，比如把类别“电脑”，“手机”编号为0和1，可使用LabelEncoder函数。作用将n个类别编码为0~n-1之间的整数(包括0和n-1)例子假设对电子产品数据进行编码，数据可以分为两

jenny_paofu

10678人浏览 · 2021-09-07 13:12:37

jenny_paofu · 2021-09-07 13:12:37 发布

python:sklearn标签编码(LabelEncoder)

sklearn.preprocessing.LabelEncoder的使用：

在训练模型之前，通常都要对数据进行一定得处理。将类别编号是一种常用的处理方法，比如把类别“电脑”，“手机”编号为0和1，可使用LabelEncoder函数。

作用
将n个类别编码为0~n-1之间的整数(包括0和n-1)

例子
假设对电子产品数据进行编码，数据可以分为两种情况：有NaN，无NaN

方法一：使用fit()函数及transform()函数

from sklearn import preprocessing

data=['电脑','手机','手机','手表']

enc=preprocessing.LabelEncoder()
enc=enc.fit(['电脑','手机','手表'])#训练LabelEncoder,将电脑，手表，手机编码为0,1,2
data=enc.transform(data)#使用训练好的LabelEncoder对原数据进行编码，也叫归一化

print(data)#[2 0 0 1]

方法二：使用fit_transform函数

from sklearn import preprocessing

data=['电脑','手机','手机','手表']

enc=preprocessing.LabelEncoder()
data=enc.fit_transform(data)#训练LabelEncoder,将电脑，手表，手机编码为0,1,2

print(data)#[2 0 0 1]

fit,transform,fit_transform区别看连接