有关解释随机森林的问题

时间:2020-10-28 14:19:53

标签: python r machine-learning random-forest

我正在查看论文的能耗数据,我想使用随机森林模型来预测具有多个特征的能耗。

在构建,训练和验证模型之后,我想尽可能多地解释数据。

在线我发现可以查看特征的重要性,以查看哪些特征对结果的影响最大。尽管我的老师问我是否有办法找出“共同导致某些结果的要素簇”。作为他使用的一个示例(此示例已完全组成):

高收入通常会导致更多的能量消耗,男人通常会导致更少的能量消耗,但是男人和高收入可能比高收入的女人导致更多的消耗

有没有可以找到这样的分组的软件包或函数?所以我想他不是在寻找功能重要性,而是在寻找诸如“群体重要性”之类的东西?我什至不知道。

0 个答案:

没有答案