评估词表以进行情感分析

时间:2020-04-19 14:27:27

标签: random-forest sentiment-analysis shap

我正在考虑评估诸如LIWC和ANEW之类的单词列表的情感维度(例如,对于LIWC而言为negemo / posemo)以进行情感分析的方法。这些单词列表为单词分配了人为的值,并允许根据单词出现来对文本的价位进行评分。现在,如果我有一个较长的文本语料库,其中每个句子都被评估为价,那么我可以使用随机森林来将句子的单词列表价值作为输入变量来预测句子的等级,然后最终使用像SHAP这样的基于置换的特征重要性来获得最重要的特征,因为根据Lundegren等人的假设,这些方法是精确的。 (2017:https://papers.nips.cc/paper/7062-a-unified-approach-to-interpreting-model-predictions.pdf)? Gomez-Ramirez等。 (2019:https://www.biorxiv.org/content/10.1101/785519v1.full.pdf)使用类似的技术来寻找预测认知下降的重要特征,现在我想知道在单词列表的情况下是否可以进行类比。感谢您的想法,如果我做出错误的推断,请原谅我,因为我对ML的了解还很初级。


编辑:同样,如果这是该问题的错误位置,请重定向我。

0 个答案:

没有答案