是否有用于自动分类文本的库,例如英语中的影响?如果它非常粗糙,它可能仍然足够好。
答案 0 :(得分:2)
通常,当我看到使用的术语“影响分类”时,它描述语音数据的处理,而不是文本 - 使用频谱,响度等音频功能来确定说话者是否生气,沮丧等等。特征类型显然不能很好地转换为文本。
当谈到对文本进行分类时,更常见的是将Sentiment,又名“意见挖掘”分类,以确定文本的作者是否对文本的主题发表了正面或负面的评论。如果这为您提供足够的细微差别,幸运的是有大量资源可以帮助您解决这个问题。在Python中,Natural Language Toolkit提供了通常用于此类工作的分类器,例如this demo。
这种方法的缺点是它通常仅限于正/负分类,并且它是非常特定于域的。例如,经过训练以检测正面电影评论的分类器在分类软件评论时表现不佳。
在文本中也有一些关于情感分类的工作,例如paper以及this one on identifying the emotional content of blog posts 不幸的是,看起来你不太可能找到“预制”库支持此任务,但鉴于研究中的信息,您应该能够在NLTK或其他分类/自然语言处理库之上构建此类系统。
答案 1 :(得分:0)
“模式”系统用于情绪分析:
比利时选举,2010年6月13日 - Twitter意见挖掘http://www.clips.ua.ac.be/pages/pattern-examples-elections
MBSP,Python的文本分析系统,http://www.clips.ua.ac.be/pages/MBSP