我正在寻找一种用于异常检测的非常复杂的模型集合的解释。
我大约有2万行有100个变量。预测是二进制概率。预测和大多数变量高度偏左(我尝试使用boxcox变换来变换分布,但效果不佳。
我可以通过自定义预测功能在此数据集上使用LIME。但是,结果是每个变量的贡献确实很低(<0.001),并且我的局部模型始终预测同一类别(概率不同,但即使在我将预测函数中的预测归一化之后)。我试图更改内核宽度并转换y和x的分布而没有成功。
有人知道为什么它不起作用以及我是否可以做些什么?
PS:很抱歉,我无法提供可重复的示例,看来我的问题确实是我的数据所特有的,我无法共享我的数据。