【推导】逻辑回归模型-sigmoid函数推导(基于信息量)

作者 : 老饼发表日期 : 2022-09-22 06:00:59 更新日期 : 2025-06-03 15:21:52

本站原创文章，转载请说明来自《老饼讲解-机器学习》www.bbbdata.com

在笔者刚接触逻辑回归模型时，总是疑问sigmoid函数怎么来的，怎么一下子就把WX转换成了概率

后来接触多了，自然也就理解了，基于信息量的概念，就可以轻松的得到逻辑回归sigmoid模型

本文讲解，如何基于信息量来推导逻辑回归模型的sigmoid函数，从而更自然地理解逻辑回归模型的意义

声明：由于没有找到具体的可靠文献，本文是笔者个人的理解，仅供参考

01. 逻辑回归模型及其推导

本节以信息量为基础，推导逻辑回归sigmoid模型是如何来的

逻辑回归模型是如何来的

逻辑回归模型的目的是判断样本为正样本的概率，

而当前我们并不知道样本的标签，但我们能获得的是样本的表征
因此，我们以样本的表征作为证据，一步一步去佐证样本究竟是正标签还是负标签就好了
逻辑回归模型原理与推导
在任何证据都没有的情况下，不妨设历史经验中，样本为正的概率为，则有：
知道标签"为正"时，所获信息量  ：
知道标签"为负"时，所获信息量：
由于现在提供了n个证据，不妨假设:
证据为"是正样本"这件事提供的信息量为
证据为"是负样本"这件事提供的信息量为
因此在已知时，最终获得的信息量应扣除这些证据所提供的信息量
    知道标签"为正"时，所获信息量  ：
     知道标签"为负"时，所获信息量：
值得注意的是，在上式中，信息量可以直接相加的前提是事件独立，即每个变量之间独立

则样本"是正"和"是负"时的信息量差为：,即：

不妨令，,则有：

进一步化简，则有：

逻辑回归模型-总结

总的来说，逻辑回归模型就是依靠一个一个的证据，来逐步增加对样本真实标签的认识
  逻辑回归模型表达式如下：

其中与的意义如下：
，它代表每个证据贡献给"正样本"和"负样本"的信息量差
，它代表历史先验概率贡献给"正样本"和"负样本"的信息量差

好了，以上就是如何基于信息量来理解逻辑回归模型的sigmoid函数了~

End

添加评论