【分类模型评价】宏平均（macro avg）、微平均(micro avg)和加权平均(weighted avg)

当我们使用 sklearn.metric.classification_report 工具对模型的测试结果进行评价时，会输出如下结果：对于精准率（precision ）、召回率（recall）、f1-score，他们的计算方法很多地方都有介绍，这里主要讲一下micro avg、macro avg 和weighted avg 他们的计算方式。1、宏平均 macro avg:对每个类别的精准、召回

Joker 007

18513人浏览 · 2022-02-14 11:28:04

Joker 007 · 2022-02-14 11:28:04 发布

当我们使用 sklearn.metric.classification_report 工具对模型的测试结果进行评价时，会输出如下结果：
在这里插入图片描述对于精准率（precision ）、召回率（recall）、f1-score，他们的计算方法很多地方都有介绍，这里主要讲一下micro avg、macro avg 和weighted avg 他们的计算方式。

1、宏平均 macro avg:

对所有类别的平均

精准macro avg
=(P_no+P_yes) / 2
=(0.24+0.73) / 2 = 0.48

2、微平均 micro avg:
对数据集中的每⼀个实例不分类别进⾏统计建⽴全局混淆矩阵，然后计算相应指标：

精准micro avg = 召回micro avg = f1_micro avg
=(TP+TN) / (TP+FP+TN+FN)
=(0.54 * 7535 +0.42 * 22462 ) / (7535+22462)=0.45

3、加权平均 weighted avg：

是对宏平均的一种改进，考虑了每个类别样本数量在总样本中占比

精准加权weighted avg
=P_no * （support_no / support_all）+ P_yes * （support_yes / support_all）
=0.24*(7525 / 29997) + 0.73*(22462 / 29997)=0.61

参考：
分类问题的几个评价指标（Precision、Recall、F1-Score、Micro-F1、Macro-F1）
混淆矩阵（Confusion Matrix）分析
 宏平均（macro avg）、微平均(micro avg)和加权平均(weighted avg)
【NLP】再看分类评估指标——宏平均，微平均

华为开发者空间

华为开发者空间，是为全球开发者打造的专属开发空间，汇聚了华为优质开发资源及工具，致力于让每一位开发者拥有一台云主机，基于华为根生态开发、创新。

更多推荐

cover

一文解读GaussDB(DWS)监控运维诊断优化能力

华为开发者空间

cover

GaussDB技术解读——GaussDB架构介绍（四）

华为开发者空间

cover

华为云数据仓库专业级开发者认证重磅发布

华为开发者空间

所有评论(0)

查看更多评论

Joker 007

已为社区贡献2条内容