我如何开始为土耳其语建立wordnet以用于情感分析

时间:2011-12-27 05:33:35

标签: wordnet sentiment-analysis

虽然我持有EE背景,但我没有机会参加自然语言处理课程。

我想为土耳其语建立情绪分析工具。我认为最好创建一个土耳其语wordnet数据库,而不是将文本翻译成英语,并使用提供的工具用错误的翻译文本进行分析。 (是吗?

那么你们建议我做什么?首先从公开课网站上学习NLP课程?我真的不知道从哪里开始。你能帮助我,也许可以一步一步向我提供指导吗?我知道这是一个学术项目,但我有兴趣将技能作为该领域的业余爱好。

提前致谢。

1 个答案:

答案 0 :(得分:4)

这是我以前使用的过程(制作日语,中文,德语和阿拉伯语语义网络):

  1. 至少收集两本英语/土耳其语词典。它们必须是独立的,而不是相互衍生的。您可以使用Wikipedia自动生成一个词典。如果您需要发布您的网络,那么您可能需要开源词典或许可费或律师。
  2. 使用这些词典翻译英文Wordnet,为每个synset产生一个置信度。
  3. 保持信心十足,手动批准或修复中等或低信任的人。
  4. 手动完成
  5. 我在2008年论文的“WordNet自动翻译”部分对此进行了扩展:http://dcook.org/mlsn/about/papers/nlp2008.MLSN_A_Multilingual_Semantic_Network.pdf

    (对于你所说的土耳其语情词典的目标,还有其他方法,不涉及语义网络。例如Bing Liu的“语义分析和意见挖掘”是一个很好的研究综述。但是语义从长远来看,恕我直言,网络方法总会给出更好的结果,还有很多其他用途。)