如何在PySpark世界中可视化变量分组或执行交互式分组?

时间:2018-08-30 13:21:26

标签: python pyspark modeling risk-management

我想知道在PySpark / Python世界中是否有一种方法可以执行交互式变量分组(类似于SAS Miner软件启用的分组)。变量分组是模型开发的重要组成部分,因此我想必须已经有一些工具/库可以支持此工作。有人对此有经验吗?谢谢

1 个答案:

答案 0 :(得分:1)

当前没有针对Python的此类库。

交互式变量分组是一个多步骤过程(在SAS Enterprise Miner中作为名为IGN的节点提供),它是SAS EM Credit Scoring解决方案的一部分,而不是基础SAS。尽管Python世界中有一些用于IGN步骤的工具,例如装箱,WoE,Gini,决策树等。Scikit-learn是一个很好的起点。

有许多Scikit-learn related项目,包括特定领域的项目。信用评分项目可能是该列表中的潜在候选人。