评分卡

【原理】评分卡概率转评分-详述

作者 : 老饼 发表日期 : 2022-06-26 10:30:50 更新日期 : 2024-11-22 05:33:47
本站原创文章,转载请说明来自《老饼讲解-机器学习》www.bbbdata.com



评分卡最终是以分数的形式输出,而不是直接使用逻辑回归模型的输出
本文讲解评分卡中模型转分数的公式、流程以及相关原理的推导
通过本文,可以了解评分卡在逻辑回归建模完成后,如何将模型输出转为评分






   01. 评分卡-模型转评分   




本节讲解评分卡中是如何将逻辑模型转为评分的




     评分卡-模型转评分     


评分卡的评分公式
评分卡模型输出的是客户的评分,评分越高代表客户的质量越好
 评分一般由逻辑回归模型的线性部分进行缩放而得到
评分卡的评分公式如下:

 
 
其中,W和b是逻辑回归模型中的W和b,offset、factor是待确定参数

 评分卡表的基础分与特征分公式
如果要制作评分卡表,则采用下式:
 
将  看作基础分, 看作第i个特征的得分
即:
                 
                 
然后预先计算好Base分和每个特征不同取值时的得分,就可以得到评分卡表:
 评分卡示例
最后,通过查表得到各个特征得分,把各个特征得分求和再加上 Base分,就是该客户的评分
    为什么使用线性部分,而不使用逻辑回归模型的预测概率进行转换? 
因为使用线性部分转分,除了能得到总分数,还能得到各个特征的得分,这样使评分卡的分数意义更易解释
 而如果用概率转分,就只能得到总分,无法得到单个特征得分,也就不能分析总分低是哪些特征导致的








    02. 如何确定offset和factor     




本节讲述如何通过odds来确定offset和factor




       factor和offset的意义      


如果直接拍脑袋确定offset和factor的值,这样是非常盲目的,因此,需要探讨一下factor和offset的意义
由逻辑回归模型表达式可知,逻辑回归模型的线性部分为:
 
一般将     记为odds,即线性部分为
  由此,分数公式也就可以记为:
  
由此可知,score是ln(odds)的线性函数,offset是阈值,factor是ln(odds)的系数
其中,offset和factor 控制了基本分数和odds增长时对应的分数增长量
因此,要确定offet、factor,实际上就是要确定基本分数和odds增长时对应的分数增长量





      如何确定offset和factor     


由于offet、factor就是控制着基本分和odds对应的分数增长
 因此,offet、factor一般通过如下设置来确定:
1. 假设odds为d时,评分为B           
2. odds每提升k倍时,分数提升S分
通过设置好d、B、k、S,进一步求得offset和factor
 d、B、k、S和offset、factor的关系如下:
 
                                  
                       
上述两式的推导过程如下:
 
一、factor的推导                                                                        
 
 由odds每降低k倍时,分数提升S分,可得:             
                    
  
化简得到:
                     
从而得到:
                        
 二、offset的推导                                                                        
 
 由odds为d时,评分为B,可得:                        
 
             
化简得到:
               
从而得到:
               









   03. 评分卡-评分表计算流程   




本节展示评分卡的分值表计算流程





   评分卡分值表-计算流程   


实际应用中,评分卡一般预先计算好Base分和每个特征不同取值时的得分表
最后,通过查表得到各个特征得分,把各个特征得分求和再加上 Base分,从而得到客户的评分
 评分卡的评分表计算流程如下:
一、设置好B,d,k,S                                                            
B,d:odds为d时,评分为B                                    
 S,k:odds每降低 k倍时,分数提升S分                   
                            【附】odds = P/(1-P) 的含义:是坏样本的概率与是好样本概率的比值
二、计算factor                                       
                   
            
三、计算BaseScore和FetureScore                                  
                   
           
总得分即为,BaseScore加上每个特征的得分FetureScore
备注:也可以把offset直接代入BaseScore中,这样基础分可直接由下式计算得到
        





    B,d,k,S常用设置     


B,d,k,S一般设为 B=600,d = 50,S=20,k = 2
 也即:
(1) odds每降低2倍(例如从50:1提升到25:1),分数提升20分
(2) 当 odds=50:1时,分数是600分                                         
 代入上式 ,即有:  
  
        






好了,以上就是评分卡中的分数转换了~








 End 





联系老饼