如何分析正面或负面单词的文本?

时间:2011-01-13 01:00:41

标签: nlp

我正在寻找某种模块(最好是python),它允许我给该模块一个大约200个字符长的字符串。然后,模块应该返回字符串有多少正面或负面的单词。 (例如,爱,喜欢,喜欢与恨,不喜欢,不好)

我真的很想避免在自然语言处理中重新发明轮子,所以如果有任何你知道的东西可以让我做我上面描述的那些,那么如果能节省大量的话,那将是一个巨大的节省时间。你可以分享。

感谢您的帮助!

3 个答案:

答案 0 :(得分:2)

答案 1 :(得分:1)

在分析文本片段之前,您需要通过条带化标点,修复语言,拆分空格,降低整个文本并将单词存储在可迭代的数据结构中来预处理给定的文本。

对于某些基本的情绪分析,可以使用以下技术:

一袋字

在单词技巧中,我们基本上通过单词的包(文件)并检查我们制作的可迭代是否包含这些。如果确实如此,那么我们为每个单词的存在分配一些值,以便权衡文本的总情绪。 此链接应该可以帮助您了解更多相关信息 https://en.wikipedia.org/wiki/Bag-of-words_model

关键字提取和标记

通过标记元素然后删除不需要的数据,可以从输入文本中提取关键字和重要信息。 例如: 我的名字是约翰。 在这里约翰,名字是信息,而“是”并不是真正需要的。 同样,可以删除动词和其他不重要的事物,以便仅保留主要信息。 Chunking和Chinking有帮助。 这个链接必须有所帮助。 http://nltk.org/book/ch07.html

答案 2 :(得分:0)

您可以使用现有的情绪分析工具标记文本并获得情绪。我知道,最全面的情感分析工具是Git Hub documentation。这基本上是对所有情绪分析工具的调查研究。以及代码和有关如何使用代码的示例。