在回归问题中,传统的损失函数形式为MAE
或MSE
,其形式如下所示:
无论是哪种损失函数,其对于预测值大于或小于label
的幅度的评估程度是一致的。
比如的值大于label
一倍和小于label
一倍,在MAE
和MSE
中体现出来的损失值是一样的,所以这两种损失函数会使模型尽量找到一个平均意义上的最佳拟合函数
而分位数损失函数如下所示:
其对小于label
的预测值赋予的权重,对大于label
的预测值赋予的权重,因此会让模型预测值倾向于权重较小部分的数值。例如的值取0.95,则大于label
的预测值对损失值的“贡献比”会很低,小于label
的预测值对损失值的“贡献比”会较高,因此,模型的预测值会偏向那些分布值较大的数据点,反之亦然
因此,的取值是多少,则当前损失函数下就是对应分位数的回归问题
分位数预测的意义在于:
- 理论上,分位数回归可以将其预测值置于高于全部训练数据或低于全部训练数据的位置,对于输入数据的鲁棒性较强
- 能够进行区间预测,得出预测值在合理范围内的预测,例如,95%分位数预测下得出的预测值,我们认为真实值有95%的概率小于这个预测值