Python的数据分析中超参数调优方法：网格搜索

【小白从小学Python、C、Java】【Python全国计算机等级考试】【Python数据分析考试必会题】● 标题与摘要Python的数据分析中超参数调优方法：网格搜索● 选择题以下说法错误的是：A 网格搜索是一种调参方法B 网格搜索会遍历几乎所有参数组合C 网格搜索的最大优点就是搜索速度快D 网格搜索在面对大数据集时会非常耗时● 问题解析1.网格搜索（Grid Search）是一种调参方法，也

刘经纬老师

10531人浏览 · 2022-03-09 07:30:13

刘经纬老师 · 2022-03-09 07:30:13 发布

【小白从小学Python、C、Java】

【Python全国计算机等级考试】

【Python数据分析考试必会题】

● 标题与摘要

Python的数据分析中

超参数调优方法：网格搜索

● 选择题

以下说法错误的是：

A 网格搜索是一种调参方法

B 网格搜索会遍历几乎所有参数组合

C 网格搜索的最大优点就是搜索速度快

D 网格搜索在面对大数据集时会非常耗时

● 问题解析

1.网格搜索（Grid Search）是一种调参方法，也称为穷举搜索，搜索的是参数，在所有候选的参数选择中，按步长依次调整参数，通过循环遍历，尝试每一种可能性，从所有的参数中找到在验证集上精度最高的参数，表现最好的参数就是最终的结果，原理就像是在数组里找到最大值。

2.网格搜索可以保证在指定的参数范围内找到精度最高的参数，因为网格搜索会遍历所有可能参数的组合，在面对大数据集和多参数的情况下会非常耗时。

3.网格搜索语法：

Class sklearn.model_selection.GridSearchCV(estimator,param_grid,scoring=None,fit_params=None,n_jobs=None,iid=’warn’,refit=True,cv=’warn’,verbose=0,pre_dispatch=‘2*n_jobs’,error_score=’raise-deprecating’,return_train_score=’warn’)

网格搜索参数说明：

（1）estimator：选择使用的分类器，并且传入需要确定最佳的参数之外的其他参数。

（2）param_grid：需要最优化的参数的取值，值为字典或者列表。

（3）scoring=None：模型评价标准，默认为None。

（4）n_jobs=1，n_jobs表示并行数，int为个数，-1表示与CPU核数一致，1为默认值。

（5）iid=True，iid默认为True，当为True时，默认为各个样本fold概率分布一致，误差估计为所有样本之和，而不是各个fold的平均。

（6）refit=True默认为True。在搜索参数结束后，用最佳参数结果再次拟合一遍全部数据集

（7）cv=None，交叉验证参数，默认None，使用三折交叉验证。

（8）verbose=0,scoring=None，verbose表示日志冗长度，0表示不输出训练过程，1表示偶尔输出，>1表示对每个子模型都输出。

（9）pre_dispatch='2*n_jobs'表示指定总共发的并行任务数。

4.网格搜索常用方法及属性：

（1）grid.fit()表示运行网格搜索