我想使用最大熵模型实现自己的情绪分析。没有使用任何Api。什么可能是我的最大熵模型的最佳特征f(c,d)。我有三个正面,负面和中立的课程
答案 0 :(得分:0)
情感分析中一些最常用且最有效的功能是 unigrams 。 Bigrams 也可以使用,但是它们是否真的有用是很有争议的。
请注意,使用unigrams / bigrams的频率值不会显着改善情感分析中的结果;因此,通常足以提取单词类型并使用布尔值来表达它们在文本中的存在/不存在。
重要的是如何在提取这些功能之前预处理文本。例如,除了对你的标记进行较低的处理外,处理否定范围可以在提取unigram特征时改善你的结果。
无论如何,情感分析是一个广泛的领域。您将发现不同的特征提取策略可能会产生不同的结果,具体取决于您需要执行的特定分析类型(例如基于特征的分析,主观性分析,极性分析等)。
您可以在这里找到几乎所有您需要的东西: