机器学习入门教程

【原理】逻辑回归模型sigmoid推导-基于信息量

作者 : 老饼 发表日期 : 2022-12-15 22:24:18 更新日期 : 2025-03-30 13:52:43
本站原创文章,转载请说明来自《老饼讲解-机器学习》www.bbbdata.com



在刚开始学习逻辑回归模型时,总是疑问sigmoid函数怎么来的

本文讲解,逻辑回归模型sigmoid函数由来的思路与推导

通过本文,可以更深刻的理解逻辑回归模型的本质,以及它的模型意义





    01. 逻辑回归模型及其推导    




本节以信息量为基础,推导逻辑回归sigmoid模型是如何来的




      逻辑回归模型是如何来的     


逻辑回归模型的目的是判断样本为正样本的概率,
 逻辑回归的模型思想
而当前我们并不知道样本的标签,但我们能获得的是样本的表征
因此,我们以样本的表征作为证据,一步一步去佐证样本究竟是正标签还是负标签就好了
逻辑回归模型原理与推导
在任何证据都没有的情况下,不妨设历史经验中,样本为正的概率为,则有:
知道标签"为正"时,所获信息量  :                   
知道标签"为负"时,所获信息量:        
由于现在提供了n个证据,不妨假设:
证据为"是正样本"这件事提供的信息量为
证据为"是负样本"这件事提供的信息量为
因此在已知时,最终获得的信息量应扣除这些证据所提供的信息量
    知道标签"为正"时,所获信息量  :             
     知道标签"为负"时,所获信息量:   
 需要注意的是,信息量可以直接相加的前提条件是事件独立,即每个变量之间独立
 逻辑回归的原理
则样本"是正"和"是负"时的信息量差为:,即:
 
不妨令 ,则有:
 
进一步化简,则有:
 





   逻辑回归模型-总结   


总的来说,逻辑回归模型就是依靠一个一个的证据,来逐步增加对样本真实标签的认识
  逻辑回归模型表达式如下:
 
 
其中的意义如下:
 ,它代表每个证据贡献给"正样本"和"负样本"的信息量差 
 ,它代表历史先验概率贡献给"正样本"和"负样本"的信息量差       






好了,以上就是逻辑回归模型的模型意义与推导了~









 End 






联系老饼