其他语言的情感分析

时间:2011-10-13 08:20:45

标签: artificial-intelligence nlp machine-learning sentiment-analysis

我的CSE毕业项目我选择模拟搜索引擎,使用情绪分析来评估评论/评论是正/负/中性

我不知道我将如何做到这一点,但我知道它使用的是您首先训练的分类代理,然后它可以自行分类。边缘不高(我明白约为60%)

我的问题是,这会用于非英语语言吗?我的意思是我想对阿拉伯语评论/评论进行情绪分析并产生适当的情绪,是否可以使用当前的分类器?如果不是,我需要编写自己的分类器,是否可以编写自定义分类器?

3 个答案:

答案 0 :(得分:8)

  

我的问题是,这会用于非英语语言吗?我的意思是我想对阿拉伯语评论/评论进行情绪分析并产生适当的情绪,是否可以使用当前的分类器?

你在这里混淆了一些事情。你称之为“分类代理”的东西恰当地称为学习者。学习者需要训练集来生成分类器。这可以应用于看不见的数据,以获得积极/消极/中立的分类。

要使机器学习的NLP任务(如此)适应新语言,您需要一个数据集来训练。大多数情绪分析工具都需要一个标记集,这可能很昂贵,而且很难得到,所以我建议你查看this answer中概述的无监督方法(无监督=从未标记数据中学习)。该方法是针对英语描述的,但我听说其他语言已取得了合理的结果。但是,YMMV基于您将要使用的确切数据集。

答案 1 :(得分:0)

有一个想法是根据youtube数据进行评论的情绪分析。

请注意,youtube上有喜欢/不喜欢的系统,因此您可以使用视频上的喜欢/不喜欢的比例为其下方的评论指定一些正/负值。

此外,您可以通过gdata api访问数据。这种方法与语言无关,您只需要分析以所选语言发布的视频。

答案 2 :(得分:0)

我的公司(Repustate.com)最近通过我们的API添加了对阿拉伯语的情绪分析。它不是免费使用API​​,但您可以尝试免费的在线演示,看它是否满足您的需求。这是一个link to the free demo