本站原创文章,转载请说明来自《老饼讲解-机器学习》www.bbbdata.com
评分卡最终是以分数的形式输出,而不是直接使用逻辑回归模型的输出
本文讲解评分卡中模型转分数的公式、流程以及相关原理的推导
通过本文,可以了解评分卡在逻辑回归建模完成后,如何将模型输出转为评分
本节讲解评分卡中是如何将逻辑模型转为评分的
评分卡-模型转评分
评分卡的评分公式
评分卡模型输出的是客户的评分,评分越高代表客户的质量越好
评分一般由逻辑回归模型的线性部分进行缩放而得到
评分卡的评分公式如下:
其中,W和b是逻辑回归模型中的W和b,offset、factor是待确定参数
评分卡表的基础分与特征分公式
如果要制作评分卡表,则采用下式:
将 看作基础分, 看作第i个特征的得分
即:
然后预先计算好Base分和每个特征不同取值时的得分,就可以得到评分卡表:
最后,通过查表得到各个特征得分,把各个特征得分求和再加上 Base分,就是该客户的评分
为什么使用线性部分,而不使用逻辑回归模型的预测概率进行转换?
因为使用线性部分转分,除了能得到总分数,还能得到各个特征的得分,这样使评分卡的分数意义更易解释
而如果用概率转分,就只能得到总分,无法得到单个特征得分,也就不能分析总分低是哪些特征导致的
本节讲述如何通过odds来确定offset和factor
factor和offset的意义
如果直接拍脑袋确定offset和factor的值,这样是非常盲目的,因此,需要探讨一下factor和offset的意义
由逻辑回归模型表达式可知,逻辑回归模型的线性部分为:
一般将 记为odds,即线性部分为
由此,分数公式也就可以记为:
由此可知,score是ln(odds)的线性函数,offset是阈值,factor是ln(odds)的系数
其中,offset和factor 控制了基本分数和odds增长时对应的分数增长量
因此,要确定offet、factor,实际上就是要确定基本分数和odds增长时对应的分数增长量
如何确定offset和factor
由于offet、factor就是控制着基本分和odds对应的分数增长
因此,offet、factor一般通过如下设置来确定:
1. 假设odds为d时,评分为B
2. odds每提升k倍时,分数提升S分
通过设置好d、B、k、S,进一步求得offset和factor
d、B、k、S和offset、factor的关系如下:
上述两式的推导过程如下:
一、factor的推导
由odds每降低k倍时,分数提升S分,可得:
化简得到:
从而得到:
二、offset的推导
由odds为d时,评分为B,可得:
化简得到:
从而得到:
本节展示评分卡的分值表计算流程
评分卡分值表-计算流程
实际应用中,评分卡一般预先计算好Base分和每个特征不同取值时的得分表
最后,通过查表得到各个特征得分,把各个特征得分求和再加上 Base分,从而得到客户的评分
评分卡的评分表计算流程如下:
一、设置好B,d,k,S
B,d:odds为d时,评分为B
S,k:odds每降低 k倍时,分数提升S分
【附】odds = P/(1-P) 的含义:是坏样本的概率与是好样本概率的比值
二、计算factor
三、计算BaseScore和FetureScore
总得分即为,BaseScore加上每个特征的得分FetureScore
备注:也可以把offset直接代入BaseScore中,这样基础分可直接由下式计算得到
B,d,k,S常用设置
B,d,k,S一般设为 B=600,d = 50,S=20,k = 2
也即:
(1) odds每降低2倍(例如从50:1提升到25:1),分数提升20分
(2) 当 odds=50:1时,分数是600分
代入上式 ,即有:
好了,以上就是评分卡中的分数转换了~
End