问题:

在训练模型 fit(x_train,y_train) 时遇到报错 ValueError: Input contains NaN, infinity or a value too large for dtype('float64')

遇到这样的问题通常是因为数据里有空值或者是无穷多的值,解决的方法:

1、检测是否有空值,True代表有,False代表没有,若有可通过填充或者删除空值


# 检查数据中是否有缺失值,以下两种方式均可
#Flase:对应特征的特征值中无缺失值
#True:有缺失值
print(train.isnull().any())
print(np.isnan(train).any())
 
#查看缺失值记录
train_null = pd.isnull(train)
train_null = train[train_null == True]
print(train_null)
 
#缺失值处理,以下两种方式均可
#删除包含缺失值的行
train.dropna(inplace=True)
#缺失值填充
train.fillna('100')

2、检测数据中是否有无穷数据,并做数据处理

#检查是否包含无穷数据
#False:包含
#True:不包含
print(np.isfinite(train).all())
#False:不包含
#True:包含
print(np.isinf(train).all())
 
#数据处理
train_inf = np.isinf(train)
train[train_inf] = 0

注意 数据处理只能用np.isinf(),其布尔值True,才能修改。

本文章摘抄于某位博主的,主要用于自身做笔记。

Logo

华为开发者空间,是为全球开发者打造的专属开发空间,汇聚了华为优质开发资源及工具,致力于让每一位开发者拥有一台云主机,基于华为根生态开发、创新。

更多推荐