# 将数据集按照比例划分为训练集和测试集
def split_datas(datas,labels,random_state=1,train_size=0.9,test_size=0.1):
	train_data, test_data, train_label, test_label = sklearn.model_selection.train_test_split(datas,
	                                                                                          labels,
	                                                                                          random_state=random_state,
	                                                                                          # 作用是通过随机数来随机取得一定量得样本作为训练样本和测试样本
	                                                                                          train_size,
	                                                                                          test_size)
	return train_data, test_data, train_label, test_label

 在运行上面代码的时候出现了错误

查了一下sklearn.model_selection.train_test_split函数的参数,发现两个参数第二个是超参数,因此我们在传入参数的时候需要指明变量,而不是直接传入

数据集划分:sklearn.model_selection.train_test_split(*arrays, **options)

主要参数说明:

*arrays:可以是列表、numpy数组、scipy稀疏矩阵或pandas的数据框

# 将数据集按照比例划分为训练集和测试集
def split_datas(datas,labels,random_state=1,train_size=0.9,test_size=0.1):
	train_data, test_data, train_label, test_label = sklearn.model_selection.train_test_split(datas,
	                                                                                          labels,
	                                                                                          random_state=random_state,
	                                                                                          # 作用是通过随机数来随机取得一定量得样本作为训练样本和测试样本
	                                                                                          train_size = train_size,
	                                                                                          test_size = test_size)
	return train_data, test_data, train_label, test_label

 

 这样就不会报错啦

Logo

为开发者提供学习成长、分享交流、生态实践、资源工具等服务,帮助开发者快速成长。

更多推荐