逻辑回归虽然看起来简单,但是确实工作中使用场景非常多的分类模型,值得认真对待
模型形式
❓为什么不用MSE
或者MAE
?
💡因为这两种损失函数在sigmoid
下都不是凸函数,不利于找到最优点
特征工程
- 特征离散化:将一些离散的特征通过离散化
one-hot
后,可以增加逻辑回归这种广义线性模型的非线性表示(可以理解为分段函数),同时离散后必然容易出现稀疏矩阵,运算速度快,且离散化后的特征对于异常值具有较强的鲁棒性。比如一个特征是年龄>30是1,否则0。如果特征没有离散化,一个异常数据“年龄300岁”会给模型造成很大的干扰。离散化后可以进行特征交叉