机器学习入门教程

【推导】逻辑回归梯度公式推导

作者 : 老饼 发表日期 : 2023-01-18 19:31:12 更新日期 : 2025-03-29 19:06:34
本站原创文章,转载请说明来自《老饼讲解-机器学习》www.bbbdata.com



使用梯度下降法训练逻辑回归时,需要使用到逻辑回归损失函数的梯度

本文给出逻辑回归损失函数的梯度公式,以及详细的推导过程

通过本文,可以了解逻辑回归的损失函数的梯度公式,如何它是如何推导出来的





    01. 逻辑回归-损失函数-回顾    




本节回顾逻辑回归的损失函数




     逻辑回归-损失函数回顾     


逻辑回归的损失函数为交叉熵损失函数
逻辑回归的损失函数公式如下:
  
 其中,
 
:第i个样本的输入变量    
 
:第i个样本的类别       
 
:样本个数              
 
:逻辑回归模型参数      





     逻辑回归-损失函数-形式二    


为了方便推导逻辑回归损失函数的梯度
我们这里引入逻辑回归损失函数的第二种形式,如下:
 
 它的推导过程如下:
 








     02. 逻辑回归损失函数-梯度推导      





 本节推导逻辑回归损失函数的梯度公式






      逻辑回归损失函数-梯度公式推导    


 由于使用梯度下降法训练逻辑回归时,需要用到逻辑回归损失函数的梯度
下面我们推导逻辑回归损失函数的梯度 
为了简化梯度公式的推导难度,
不妨先对逻辑回归单个参数进行求导,再进下推及到整体参数的梯度
推导过程如下:

 先对W的单个元素j进行求导:



------由于  ,上式可写为-----
                    
-------------用矩阵形式替换连加形式---------------
  // (p-y)*X的第j列
逻辑回归损失函数整体梯度公式
将逻辑回归损失函数单参数的梯度公式,
按形式推广到整体参数,则有:

 

 
 
其中
 X :
矩阵, m样本数, n为特征个数
     即一行为一个样本,一列为一特征 
        y : 样本的真实标签,列向量           
 p :模型预测的概率,列向量     







上述就是逻辑回归梯度公式推导的全部内容了~









 End 





联系老饼