ovr&ovo

one-vs-rest：对于每个类别，将其他类别视为负样本。因此，当总类别数为 $N$ 时，共训练 $N$ 个模型（神经网络的softmax也可以理解成这样），预测时将样本特征输入到 $N$ 个分类器中，得到 $N$ 个概率预测值，选预测值最大的作为最终的预测类别（或者给每个分类器经过sigmoid激活函数，直接输出类别判断，通过投票确定）
one-vs-one：将数据集按类别成对分割，每两个类别训练一个二分类器，故 $N$ 个类别训练 $N(N-1)/2$ 个分类器，例如现有 $A B C D$ 四个类别，对于类别 $A$ 和类别 $B$ ，训练时只拿数据集中类别为 $A$ 和 $B$ 的数据，预测时将样本特征输入到这 $N(N-1)/2$ 个分类器中，每个分类器会给出一个预测分类结果，统计全部分类器的结果，按投票多少决定该样本最终分类

两种框架的优缺点：

one-vs-rest：优点：
1. 所需分类器较少
2. 实现简单，直接对全部数据和所有类别进行训练缺点：
3. 类别间数据不平衡，每个分类器都是以一个类别的数据面对其他所有类别之和，容易影响分类器的表现
4. 决策边界较为模糊，即每个分类器的负样本中包含若干个类，多个类的数据点在特征空间中容易出现重合，从而影响分类器判断）❓如何解决多类数据点重叠？💡使用支持向量机的非线性核函数、boosting、bagging
one-vs-one：优点：
1. 分类器较简单，每个分类器只负责两个类别的数据
2. 决策边界清晰，同样是因为每个分类器只处理两类数据缺点：分类器数量多，随着类别数量增加，分类器数量呈二次增长

这是最常用的一种方法。对于每个类别，都将其视为正类，其余类别视为负类，从而转化为一个二分类问题。然后，对每个类别分别计算ROC曲线，并计算AUC值。最后，可以通过对这些AUC值取平均（Macro-average）或加权平均（Weighted-average）来得到整体的多分类AUC值。

示例：假设有三类样本（类别1、类别2、类别3），则需要对每个类别分别计算ROC曲线，得到三条ROC曲线。最后，可以对这三条ROC曲线取平均或加权平均，得到整体的ROC曲线。

这种方法将多分类问题转化为多个二分类问题，但每次只选择两个类别进行比较。对于N个类别的分类问题，需要构建N(N-1)/2个二分类器。然后，对每个二分类器计算ROC曲线和AUC值，最后对这些AUC值取平均得到多分类AUC值。

示例：对于三类样本（类别1、类别2、类别3），需要构建3个二分类器（类别1 vs 类别2、类别1 vs 类别3、类别2 vs 类别3）。然后，对每个二分类器计算ROC曲线和AUC值，最后取平均值。

macro&micro

对于recall、precision、f1score、roc_auc_score等评价指标，在多分类的情况下，通常分为两种计算方式macro和micro

对每个类别计算相应的指标，例如recall，随后将不同类的指标求均值

进行指标计算拆解，例如：

\begin{gather} recall=\frac{TP}{TP+FN} \end{gather}

将各个类的 $TP$ 、 $FN$ 全部加在一起，算一个整体的recall