我对随机森林中变量之间的互动效应感兴趣。 我在这里找到了一些信息https://www.stat.berkeley.edu/~breiman/RandomForests/cc_home.htm#workings。
所使用的交互的操作定义是,如果在树中的一个变量(例如m)上的拆分使得k上的拆分系统地更不可能或更可能,则变量m和k相互作用。使用的实现基于林中每棵树的gini值g(m)。这些是针对每棵树的排名,并且对于每两个变量,他们的排名的绝对差异在所有树上被平均。
这个数字也是在假设两个变量彼此独立而后者从前者中减去的情况下计算的。
大的结果值表示排斥的相互作用。
但我想知道任何两个变量之间的分裂之间的距离是否意味着它们的基尼值之间的绝对差异较小?
如果这种方法可以告诉我关于这种交互的类型的什么,或者我需要使用部分依赖性呢?
感谢您的帮助。