我们将用逻辑回归Fisher线性判别分析两种分类算法实现二分类模型。

水果的例子:

对于因变量为分类变量的情况,我们可以使用逻辑回归进行处理。
y看成事件发生的概率,y>0.5表示发生;y<0.5表示不发生

 逻辑回归步骤(spss):
第一步:数据预处理:生成虚拟变量

 

预测成功率

逻辑回归系数表

 表格中新添两列解读

 y_hat:预测量

逐步回归的设置

 假如自变量有虚拟变量怎么办?

预测结果较差怎么办?
可在logistic回归模型中加入平方项、交互项等 

加入了平方项的结果 

 加入平方项后,虽然预测能力提高了,可能会出现过拟合现象。

对于样本数据的预测非常好,但是对于样本外的数据的预测结果可能会很差。

如何确定合适的模型呢?

把数据分为训练组测试组

用训练组的数据来估计出模型,再用测试组的数据来进行测试。(训练组和测试组的比例一般设置为80% 20%)

 

Fisher线性判别分析步骤(spss)

 结果分析:

多分类分析 

 Fisher判别式用于多分类

结果:
 

 

Logo

为开发者提供学习成长、分享交流、生态实践、资源工具等服务,帮助开发者快速成长。

更多推荐