第六章 平均绝对误差(MAE)与均方根误差(RMSE)
本章主要介绍了平均绝对误差、均方根误差及其代码实现。
·
目录
6.1 平均绝对误差
有关介绍的网站:https://en.wikipedia.org/wiki/Mean_absolute_error(注:下面的一些图片转载自该网站,并非原创)。
6.1.1 平均绝对误差概念
在统计学中,平均绝对误差( Mean Absolute Error,MAE ) 是对表达相同现象的成对观察之间的误差的度量。MAE 与均方根误差(RMSE) 不同,MAE 在概念上比 RMSE 更简单,也更容易解释:它只是散点图中每个点与 Y=X 线之间的平均绝对垂直或水平距离。换言之,MAE 是 X 和 Y 之间的平均绝对差值。此外,每个误差对 MAE 的贡献与误差的绝对值成正比。这与涉及对误差进行平方的 RMSE 形成对比,因此一些较大的误差将使 RMSE 比 MAE 增加的程度更大。
图1 平均绝对误差公式
图2 MAE和RMSE的 2 个数据点,数量不一致为 0,分配不一致为 2
6.1.2 Python代码实现平均绝对误差
def calculate_the_MAE(predicted_data,actual_data):
'''
该函数用于计算平均绝对误差
Parameters
----------
predicted_data : 一维列表
预测数据.
actual_data : 一维列表
真实数据.
Returns
-------
MAE : 浮点型
平均绝对误差.
'''
# 定义一个变量用于存储所有样本的绝对误差之和
the_sum_of_error = 0
# 开始逐渐遍历每一个样本
for i in range(len(actual_data)):
# 不断累加求和,计算所有样本的绝对误差之和
the_sum_of_error += abs(predicted_data[i]-actual_data[i])
# 计算所有样本的平均绝对误差
MAE = the_sum_of_error/float(len(actual_data))
return MAE
if '__main__' == __name__:
# 定义一组真实数据
actual_data = [1,2,3,4,5,6,7,8,9,10]
# 定义一组预测数据
predicted_data = [2,4,3,5,4,6,5,7,6,8]
# 调用calculate_the_MAE函数计算平均绝对误差
Mean_Absolute_Error = calculate_the_MAE(predicted_data, actual_data)
6.2 均方根误差
有关介绍的网站:https://en.wikipedia.org/wiki/Root-mean-square_deviation。
6.2.1 均方根误差的概念
MAE的方法可能会有分类讨论的情况,一般不太用,我们可以用均方根误差(Root-mean-square deviation)。均方根误差( Root,Mean Square Deviation,RMSE ) 是模型预测的值(样本或总体值)与观察值之间差异的常用度量。
图3 均方根误差公式
6.2.2 Python代码实现均方根误差
# 导入包
from math import sqrt
def calculate_the_RMSE(predicted_data,actual_data):
'''
该函数用于计算均方根误差
Parameters
----------
predicted_data : 一维列表
预测数据.
actual_data : 一维列表
真实数据.
Returns
-------
RMSE : 浮点型
均方根误差.
'''
# 定义一个变量用于存储所有样本的平方误差之和
the_sum_of_error = 0
# 开始逐渐遍历每一个样本
for i in range(len(actual_data)):
# 计算预测数据与真实数据的误差
predition_error = predicted_data[i]-actual_data[i]
# 不断累加求和,计算所有样本的平方误差之和
the_sum_of_error += predition_error**2
# 计算所有样本的均方根误差
RMSE = sqrt(the_sum_of_error/float(len(actual_data)))
return RMSE
if '__main__' == __name__:
# 定义一组真实数据
actual_data = [1,2,3,4,5,6,7,8,9,10]
# 定义一组预测数据
predicted_data = [2,4,3,5,4,6,5,7,6,8]
# 调用calculate_the_RMSE函数计算均方根误差
rmse = calculate_the_RMSE(predicted_data, actual_data)
更多推荐
已为社区贡献1条内容
所有评论(0)