bbbrisk-api说明

【说明】bins.merge.chi2

作者 : 老饼 发表日期 : 2023-05-21 10:58:32 更新日期 : 2025-03-05 16:10:27
本站原创文章,转载请说明来自《老饼讲解-机器学习》www.bbbdata.com




bins.merge.chi2- 卡方分箱(连续变量)函数

一、函数说明

bins.merge.chi2用于将连续变量进行卡方分箱,返回分箱的结果

卡方分箱就是先用等频分箱进行初始分箱,然后根据卡方值逐步合并,直到目标分箱个数


bins.merge.chi2的完整调用格式如下:

 bin_set = bins.merge.chi2(x,y,bin_num = 5,init_bin_num=10)

1. 入参说明

  • x:需要进行分箱的变量

     数据类型:单列pandas.core.series或numpy.array

  • y:好坏标签,0为好,1为坏

     数据类型:单列pandas.core.series或numpy.array

  • bin_num:目标分箱个数

   数据类型:正整数

  • init_bin_num:初始分箱个数

   数据类型:正整数


2. 出参说明

  • bin_set:等距分箱的结果






二、函数示例


chi2使用示例如下:


import bbbrisk as br					
           
# 加载数据                    
data = br.datasets.load_bloan()                               # 加载数据
x,y  = data['rev'],data['is_bad']                             # 变量与标签	

# 卡方分箱				           
bin_set  = br.bins.merge.chi2(x,y,bin_num = 5,init_bin_num=10)  # 将变量进行卡方分箱
bin_stat = br.bins.Bins(bin_set).binStat(x,y)                   # 统计分箱结果

# 显示结果
br.display.pd.set(width=300,max_colwidth=30,max_rows=30)        # 美化pandas的显示方式
print('\n分箱结果:\nbin_set = ',bin_set)                        # 显示分箱结果
print('\n样本在分箱的分布:\n',bin_stat)                         # 显示样本分布


运行结果如下:







好了,以上就是bins.merge.chi2函数的使用方法了~








 End 





联系老饼