应用错误收集

其他语言的情感分析

时间：2011-10-13 08:20:45

标签： artificial-intelligence nlp machine-learning sentiment-analysis

我的CSE毕业项目我选择模拟搜索引擎，使用情绪分析来评估评论/评论是正/负/中性

我不知道我将如何做到这一点，但我知道它使用的是您首先训练的分类代理，然后它可以自行分类。边缘不高（我明白约为60％）

我的问题是，这会用于非英语语言吗？我的意思是我想对阿拉伯语评论/评论进行情绪分析并产生适当的情绪，是否可以使用当前的分类器？如果不是，我需要编写自己的分类器，是否可以编写自定义分类器？

3 个答案:

答案 0 :(得分：8)

我的问题是，这会用于非英语语言吗？我的意思是我想对阿拉伯语评论/评论进行情绪分析并产生适当的情绪，是否可以使用当前的分类器？

你在这里混淆了一些事情。你称之为“分类代理”的东西恰当地称为学习者。学习者需要训练集来生成分类器。这可以应用于看不见的数据，以获得积极/消极/中立的分类。

要使机器学习的NLP任务（如此）适应新语言，您需要一个数据集来训练。大多数情绪分析工具都需要一个标记集，这可能很昂贵，而且很难得到，所以我建议你查看this answer中概述的无监督方法（无监督=从未标记数据中学习）。该方法是针对英语描述的，但我听说其他语言已取得了合理的结果。但是，YMMV基于您将要使用的确切数据集。

答案 1 :(得分：0)

有一个想法是根据youtube数据进行评论的情绪分析。

请注意，youtube上有喜欢/不喜欢的系统，因此您可以使用视频上的喜欢/不喜欢的比例为其下方的评论指定一些正/负值。

此外，您可以通过gdata api访问数据。这种方法与语言无关，您只需要分析以所选语言发布的视频。

答案 2 :(得分：0)

我的公司（Repustate.com）最近通过我们的API添加了对阿拉伯语的情绪分析。它不是免费使用API，但您可以尝试免费的在线演示，看它是否满足您的需求。这是一个link to the free demo。