目录

6.1 平均绝对误差

6.1.1 平均绝对误差概念

6.1.2 Python代码实现平均绝对误差

6.2 均方根误差

6.2.1 均方根误差的概念

6.2.2 Python代码实现均方根误差


6.1 平均绝对误差

        有关介绍的网站:https://en.wikipedia.org/wiki/Mean_absolute_error(注:下面的一些图片转载自该网站,并非原创)。

6.1.1 平均绝对误差概念

        在统计学中,平均绝对误差( Mean Absolute Error,MAE ) 是对表达相同现象的成对观察之间的误差的度量。MAE 与均方根误差(RMSE) 不同,MAE 在概念上比 RMSE 更简单,也更容易解释:它只是散点图中每个点与 Y=X 线之间的平均绝对垂直或水平距离。换言之,MAE 是 X 和 Y 之间的平均绝对差值。此外,每个误差对 MAE 的贡献与误差的绝对值成正比。这与涉及对误差进行平方的 RMSE 形成对比,因此一些较大的误差将使 RMSE 比 MAE 增加的程度更大。

MAE = \frac{\sum \limits_{i=1}^n \left | predicted_i-actual_i \right |}{n}

图1 平均绝对误差公式

图2 MAE和RMSE的 2 个数据点,数量不一致为 0,分配不一致为 2

6.1.2 Python代码实现平均绝对误差

def calculate_the_MAE(predicted_data,actual_data):
    '''
    该函数用于计算平均绝对误差
    Parameters
    ----------
    predicted_data : 一维列表
        预测数据.
    actual_data : 一维列表
        真实数据.

    Returns
    -------
    MAE : 浮点型
        平均绝对误差.

    '''
    # 定义一个变量用于存储所有样本的绝对误差之和
    the_sum_of_error = 0
    # 开始逐渐遍历每一个样本
    for i in range(len(actual_data)):
        # 不断累加求和,计算所有样本的绝对误差之和
        the_sum_of_error += abs(predicted_data[i]-actual_data[i])
    # 计算所有样本的平均绝对误差
    MAE = the_sum_of_error/float(len(actual_data))
    return MAE

if '__main__' == __name__:
    # 定义一组真实数据
    actual_data =    [1,2,3,4,5,6,7,8,9,10]
    # 定义一组预测数据
    predicted_data = [2,4,3,5,4,6,5,7,6,8]
    # 调用calculate_the_MAE函数计算平均绝对误差
    Mean_Absolute_Error = calculate_the_MAE(predicted_data, actual_data)

6.2 均方根误差

         有关介绍的网站:https://en.wikipedia.org/wiki/Root-mean-square_deviation

6.2.1 均方根误差的概念

        MAE的方法可能会有分类讨论的情况,一般不太用,我们可以用均方根误差(Root-mean-square deviation)。均方根误差( Root,Mean Square Deviation,RMSE ) 是模型预测的值(样本或总体值)与观察值之间差异的常用度量。

RMSE = \sqrt\frac{\sum\limits_{i=1}^n(predicted_i-actual_i)^2}{n}

图3 均方根误差公式

6.2.2 Python代码实现均方根误差

# 导入包
from math import sqrt

def calculate_the_RMSE(predicted_data,actual_data):
    '''
    该函数用于计算均方根误差
    Parameters
    ----------
    predicted_data : 一维列表
        预测数据.
    actual_data : 一维列表
        真实数据.

    Returns
    -------
    RMSE : 浮点型
        均方根误差.

    '''
    # 定义一个变量用于存储所有样本的平方误差之和
    the_sum_of_error = 0
    # 开始逐渐遍历每一个样本
    for i in range(len(actual_data)):
        # 计算预测数据与真实数据的误差
        predition_error = predicted_data[i]-actual_data[i]
        # 不断累加求和,计算所有样本的平方误差之和
        the_sum_of_error += predition_error**2
    # 计算所有样本的均方根误差
    RMSE = sqrt(the_sum_of_error/float(len(actual_data)))
    return RMSE

if '__main__' == __name__:
    # 定义一组真实数据
    actual_data =    [1,2,3,4,5,6,7,8,9,10]
    # 定义一组预测数据
    predicted_data = [2,4,3,5,4,6,5,7,6,8]
    # 调用calculate_the_RMSE函数计算均方根误差
    rmse = calculate_the_RMSE(predicted_data, actual_data)

Logo

华为开发者空间,是为全球开发者打造的专属开发空间,汇聚了华为优质开发资源及工具,致力于让每一位开发者拥有一台云主机,基于华为根生态开发、创新。

更多推荐