纠错——【Singleton array array(0.2) cannot be considered a valid collection.】

# 将数据集按照比例划分为训练集和测试集def split_datas(datas,labels,random_state=1,train_size=0.9,test_size=0.1):train_data, test_data, train_label, test_label = sklearn.model_selection.train_test_split(datas,.

有情怀的机械男

13457人浏览 · 2021-12-29 19:14:37

有情怀的机械男 · 2021-12-29 19:14:37 发布

# 将数据集按照比例划分为训练集和测试集
def split_datas(datas,labels,random_state=1,train_size=0.9,test_size=0.1):
	train_data, test_data, train_label, test_label = sklearn.model_selection.train_test_split(datas,
	                                                                                          labels,
	                                                                                          random_state=random_state,
	                                                                                          # 作用是通过随机数来随机取得一定量得样本作为训练样本和测试样本
	                                                                                          train_size,
	                                                                                          test_size)
	return train_data, test_data, train_label, test_label

在运行上面代码的时候出现了错误

查了一下sklearn.model_selection.train_test_split函数的参数，发现两个参数第二个是超参数，因此我们在传入参数的时候需要指明变量，而不是直接传入

数据集划分：sklearn.model_selection.train_test_split(*arrays, **options)

主要参数说明：

*arrays：可以是列表、numpy数组、scipy稀疏矩阵或pandas的数据框

# 将数据集按照比例划分为训练集和测试集
def split_datas(datas,labels,random_state=1,train_size=0.9,test_size=0.1):
	train_data, test_data, train_label, test_label = sklearn.model_selection.train_test_split(datas,
	                                                                                          labels,
	                                                                                          random_state=random_state,
	                                                                                          # 作用是通过随机数来随机取得一定量得样本作为训练样本和测试样本
	                                                                                          train_size = train_size,
	                                                                                          test_size = test_size)
	return train_data, test_data, train_label, test_label