如何区分重要特征与xgboost或随机森林的方向?

时间:2019-10-10 02:41:49

标签: nlp random-forest xgboost sentiment-analysis text-classification

我现在正在研究二进制文本分类问题(例如情感分析),仅通过mWebView.setWebChromeClient(new WebChromeClient()); //support JavaScript mWebView.getSettings().setJavaScriptEnabled(true);

即可提取xgboost或随机森林的重要功能很简单。

假设针对该分类问题我们有两个标记1和0。那么有什么方法可以打印出特征的方向(正或负)?说,单词特征A具有标记为1的丰富或高tfidf。

当然,我可以拉出该特定单词特征的tfidf列,并与带有皮尔逊系数的标签相关联,系数的+/-将指示方向,对吗?用于此或xgboost和随机森林的任何其他更优雅的方法都内置了此类功能。 (我没找到)

谢谢

2 个答案:

答案 0 :(得分:2)

除了Lime(Sam H建议)以外,SHAP也是这里的选择。

答案 1 :(得分:1)

这并不是您所要的,但是我通常使用enter image description here来做到这一点。即使切换模型,我也喜欢它的工作方式。