我想知道在PySpark / Python世界中是否有一种方法可以执行交互式变量分组(类似于SAS Miner软件启用的分组)。变量分组是模型开发的重要组成部分,因此我想必须已经有一些工具/库可以支持此工作。有人对此有经验吗?谢谢
答案 0 :(得分:1)
当前没有针对Python的此类库。
交互式变量分组是一个多步骤过程(在SAS Enterprise Miner中作为名为IGN的节点提供),它是SAS EM Credit Scoring解决方案的一部分,而不是基础SAS。尽管Python世界中有一些用于IGN步骤的工具,例如装箱,WoE,Gini,决策树等。Scikit-learn是一个很好的起点。
有许多Scikit-learn related项目,包括特定领域的项目。信用评分项目可能是该列表中的潜在候选人。