应用错误收集

如何区分重要特征与xgboost或随机森林的方向？

时间：2019-10-10 02:41:49

标签： nlp random-forest xgboost sentiment-analysis text-classification

我现在正在研究二进制文本分类问题（例如情感分析），仅通过mWebView.setWebChromeClient(new WebChromeClient()); //support JavaScript mWebView.getSettings().setJavaScriptEnabled(true);

即可提取xgboost或随机森林的重要功能很简单。

假设针对该分类问题我们有两个标记1和0。那么有什么方法可以打印出特征的方向（正或负）？说，单词特征A具有标记为1的丰富或高tfidf。

当然，我可以拉出该特定单词特征的tfidf列，并与带有皮尔逊系数的标签相关联，系数的+/-将指示方向，对吗？用于此或xgboost和随机森林的任何其他更优雅的方法都内置了此类功能。（我没找到）

谢谢

2 个答案:

答案 0 :(得分：2)

除了Lime（Sam H建议）以外，SHAP也是这里的选择。

答案 1 :(得分：1)

这并不是您所要的，但是我通常使用来做到这一点。即使切换模型，我也喜欢它的工作方式。