AUC
为ROC
曲线下的面积,ROC
曲线的横坐标为假阳率,纵坐标为真阳率,该曲线越靠近左上角,越说明分类器不止能将真正为阳性的样本尽可能多的分辨出来,同时还能够尽可能少地将阴性样本错分为阳性样本,整体具有较好的效果
同时,由于横纵坐标的区间都为[0, 1],因此AUC
的值不会大于1
当AUC
的值取0.5时,表示分类器等同于随机猜测(相当于猜测抛硬币的正反面,总会有50%的几率猜对),当AUC
的值大于0.5时,表明分类器更倾向于能把阳性样本准确地找出来(因为我们训练分类器的目的就是找到正样本),而当AUC
的值小于0.5时,表明分类器不仅不擅长找出阳性样本,反而更倾向于给出阴性样本的预测结果,还不如随机猜测来得好
所以,综上所述,当评价一个分类器的性能好坏时,一般可以通过看AUC
的值超过0.5多少来决定