简介

我们不妨先看下定义:

第一类错误:原假设是正确的,却拒绝了原假设。
第二类错误:原假设是错误的,却没有拒绝原假设。

第一类错误即 I 型错误是指拒绝了实际上成立的H0,为“弃真”的错误,其概率通常用α表示,这称为显著性水平。α可取单侧也可取双侧,可以根据需要确定α的大小,一般规定α=0.05或α=0.01。
第二类错误即 II 型错误是指不拒绝实际上不成立的H0,为“存伪”的错误,其概率通常用β表示。β只能取单尾,假设检验时一般不知道β的值,在一定条件下(如已知两总体的差值δ、样本含量n和检验水准α)可以测算出来。

来自:传送门

我们知道,一型错误往往利用 α分位数进行假设推断,而二型错误我们则用 β 值进行衡量

一,二型错误之间的联系

对于实际情况来说,我们可以看到预测情况与真实情况之间的数量关系,即混淆矩阵:

 

 

我们假设有原假设H0和备择假设H1,那么利用自己的data构造统计量,即构造某种满足H0的统计量分布;同样的我们也可以构造某种满足H1的统计量分布:

 


其中虚线表示分位数 α , 黑色曲线表示H0统计量分布,红色曲线表示H1统计量分布
这样一来,H0极端情况(小概率事件)为虚线右侧与黑色分布曲线相围成的面积,并且定义为FP(α);对于H1极端情况(小概率事件)为虚线左侧与红色分布曲线相围成的面积,并且定义为FN(β)

那么倘若我们想降低一型错误发生率,即将虚线往右移动,那么势必会增大二型错误发生率;同样,我们想降低二型错误发生率,即将虚线往右移动,那么势必会增大一型错误发生率
唯一降低两型错误发生率的办法是提高样本量,使得二者分母都变大

拓展

我们往往在做统计推断的时候只考虑一型错误发生情况(即 α 分位数),那是因为我们往往围绕H0构造统计量(比较好构造);而H1的统计量分布往往不太好求,并且二型错误发生情况必须知道H1的统计量分布才能求出,所以我们一般做简单的统计推断时不考虑二型错误

Logo

为开发者提供学习成长、分享交流、生态实践、资源工具等服务,帮助开发者快速成长。

更多推荐