我的CSE毕业项目我选择模拟搜索引擎,使用情绪分析来评估评论/评论是正/负/中性
我不知道我将如何做到这一点,但我知道它使用的是您首先训练的分类代理,然后它可以自行分类。边缘不高(我明白约为60%)
我的问题是,这会用于非英语语言吗?我的意思是我想对阿拉伯语评论/评论进行情绪分析并产生适当的情绪,是否可以使用当前的分类器?如果不是,我需要编写自己的分类器,是否可以编写自定义分类器?
答案 0 :(得分:8)
我的问题是,这会用于非英语语言吗?我的意思是我想对阿拉伯语评论/评论进行情绪分析并产生适当的情绪,是否可以使用当前的分类器?
你在这里混淆了一些事情。你称之为“分类代理”的东西恰当地称为学习者。学习者需要训练集来生成分类器。这可以应用于看不见的数据,以获得积极/消极/中立的分类。
要使机器学习的NLP任务(如此)适应新语言,您需要一个数据集来训练。大多数情绪分析工具都需要一个标记集,这可能很昂贵,而且很难得到,所以我建议你查看this answer中概述的无监督方法(无监督=从未标记数据中学习)。该方法是针对英语描述的,但我听说其他语言已取得了合理的结果。但是,YMMV基于您将要使用的确切数据集。
答案 1 :(得分:0)
有一个想法是根据youtube数据进行评论的情绪分析。
请注意,youtube上有喜欢/不喜欢的系统,因此您可以使用视频上的喜欢/不喜欢的比例为其下方的评论指定一些正/负值。
此外,您可以通过gdata api访问数据。这种方法与语言无关,您只需要分析以所选语言发布的视频。
答案 2 :(得分:0)
我的公司(Repustate.com)最近通过我们的API添加了对阿拉伯语的情绪分析。它不是免费使用API,但您可以尝试免费的在线演示,看它是否满足您的需求。这是一个link to the free demo。