bbbrisk-api说明

【说明】bins.batch.bin_stats

作者 : 老饼 发表日期 : 2022-11-28 12:20:14 更新日期 : 2025-03-05 15:50:44
本站原创文章,转载请说明来自《老饼讲解-机器学习》www.bbbdata.com




bins.batch.bin_stats- 分箱的分布统计函数

一、函数说明

bins.batch.autoBins用于将变量进行自动分箱

完整调用格式如下:

 bin_stats = bins.batch.bin_stats(x,y,bin_sets)

1. 入参说明

  • x:变量数据

         数据类型:pandas.DataFrame

  • y:样本标签,0为好,1为坏

         数据类型:单列pandas.core.series

  • bin_sets:各个变量的分箱配置

     数据类型:dict



2. 出参说明

  • bin_stats:数据在各个变量分箱中的分布

     数据类型:dict






二、函数示例



bin_stats使用示例如下:

import  bbbrisk  as br

# 加载数据                                                                     
data = br.datasets.load_bloan()                                      # 加载数据
x,y  = data[['rev','age']],data['is_bad']                            # 变量与标签

# 变量的分箱
bin_sets = {
    'rev'     :[['-',0.1],[0.1,1.2],[1.2,2],[2,'+']]
    ,'age'    :[[80,'+'],[60,80],[45,60],['-',45]]
    }
bin_stats = br.bins.batch.bin_stats(x,y,bin_sets)                    # 统计各个变量的分箱情况
for var in bin_stats:                                                # 逐个变量打印分箱结果
    print('\n变量'+var+'的分箱结果:\n',bin_stats[var])               # 打印当前变量的分箱统计结果


运行结果如下:






好了,以上就是bins.bin_stats函数的使用方法了~








 End 





联系老饼