我正在尝试进行一些数据分析,其想法是使用autobinning
命令创建最佳箱柜,计算每个箱柜的WOE(证据权重)值,然后替换属于的原始值每个箱子具有相应的WOE值。以下是我的工作:
CreSC = creditscorecard(Data_Table ,'IDVar','CustID','GoodLabel',0);
scAB = autobinning(CreSC,'Algorithm','Monotone');
DataTransformed = bindata(scAB,t_Data,'OutputType','WOE');
问题是上述过程不考虑DATA中的NaN
值并自动排除它们。
我的目标是仅为NaN
值创建单独的bin,并强制autobinning
命令考虑NaN
值。
有没有人有合理的解决方案?
答案 0 :(得分:2)
查找所有NaN值。
选择数据中不存在的值。
用此值替换所有NaN值。
运行binning,最后将此值自己映射到NaN。