本站原创文章,转载请说明来自《老饼讲解-机器学习》www.bbbdata.com
bins.batch.bin_stats- 分箱的分布统计函数
bins.batch.autoBins用于将变量进行自动分箱
完整调用格式如下:
bin_stats = bins.batch.bin_stats(x,y,bin_sets)
1. 入参说明
数据类型:pandas.DataFrame
数据类型:单列pandas.core.series
数据类型:dict
2. 出参说明
数据类型:dict
bin_stats使用示例如下:
import bbbrisk as br
# 加载数据
data = br.datasets.load_bloan() # 加载数据
x,y = data[['rev','age']],data['is_bad'] # 变量与标签
# 变量的分箱
bin_sets = {
'rev' :[['-',0.1],[0.1,1.2],[1.2,2],[2,'+']]
,'age' :[[80,'+'],[60,80],[45,60],['-',45]]
}
bin_stats = br.bins.batch.bin_stats(x,y,bin_sets) # 统计各个变量的分箱情况
for var in bin_stats: # 逐个变量打印分箱结果
print('\n变量'+var+'的分箱结果:\n',bin_stats[var]) # 打印当前变量的分箱统计结果
运行结果如下:
好了,以上就是bins.bin_stats函数的使用方法了~
End