嗨,我一直在尝试编写python函数,以将具有相似证据权重(WoE)值的项目组合在一起以形成(特征)属性,并返回属性段列表[0,2) ,[2,6),[6,12)等,从而最大化单变量Gini值。
对我来说,最困难的部分是想出一种有效的方法来生成理想的3-6个组-我可以从[0,1)一直到[0,max)形成第一组和第二组组[1,2)并尝试所有可能的方法,但是我有点担心我的PC是否会向我道别,如果我将其送入这个惊人的循环。
对于如何设计系统以随机生成段/箱的任何提示将不胜感激,因此系统能够基于箱内的组计算基尼系数,直到找到最大值。非常感谢!