我应该选择哪些项目参加NLP夏季研讨会?

时间:2011-03-23 19:48:21

标签: artificial-intelligence nlp machine-learning

我打算参加印度自然语言处理项目的高级夏季研讨会。 在研讨会开始之前,我必须从以下四个方面做出项目偏好,而我对这些领域知之甚少。

  

机器翻译开发英语 - 印度语翻译   系统

     

解析构建印度语(IL)解析器。

     

形态分析开发和测试形态分析仪   印度语言。

     

演讲口语对话系统,情感/韵律检测,综合   和转换

我参加了人工智能课程,其中引入了NLP和基本子主题,如 POS标记(基于转换的学习),使用N-gram的单词预测,隐马尔可夫模型,维特比算法,自然语言解析,覆盖了上下文无关语法,CKY算法

我理解这是一个有点模糊的问题,选择主要取决于我的兴趣,但是会在研究范围,实际应用,行业机会等方面更好地指导哪些领域会更好。

编辑:在NLP之外的项目工作中获得的技能/经验的应用也是决定的一个因素。

4 个答案:

答案 0 :(得分:4)

我会选择形态分析仪。形态分析器是使用有趣的单词结构在语言中执行任何NLP的先决条件,并且有许多语言在那里几乎没有完成任何工作。为你熟悉的语言建立一个良好的形态分析器是一个合理的夏季项目,所以你可以走出研讨会,建立一个其他人会喜欢的有用的软件。

其他领域现在是更热门的话题,可能在你的简历上看起来更好,但它们也更加开放,并且相对初学者更难以做出任何真正的贡献。

答案 1 :(得分:2)

让我们首先将四个选项分组为一个类别中的前三个 - NL-Text,将另外四个选项分组为其他-NL-Speech,因为追求这些选项所需的技能组合和倾向略有不同。 所以首先使用你喜欢在第一组或第二组工作的标准。完成后,您选择语音。你完成了 但如果你在另一边,现在有两个类别MT和剩余的MA和IL解析。构建MT将专注于使用现成的组件并使其适应您的语言对。如果你应该在统计上做到这一点,那么它在数据方面就没那么多,而且你没有获得太多收益,我的意思是学习/工作和其他两个一样。如果这是基于规则的,很少有人认为它很大 - 但是你会学到很多东西。构建IL解析器是一个很好的选择,可能对将来的任务非常有用,因为IL中有大量数据,然后文本处理行业将蓬勃发展。因此,考虑到行业的未来范围,考虑我的+1。同样的情况是形态分析。

答案 2 :(得分:0)

我个人认为所有这些都非常实际和相关,并且归结为您的个人兴趣。我个人去参加演讲,因为它似乎是四个中最广泛的(相对无限的改进空间)所以研究范围非常有趣。如果您更倾向于使用更具体的应用程序,那么解析和机器翻译似乎就好了。

祝你好运,无论你选择什么,这看起来都是一个惊人的机会和巨大的挑战。

答案 3 :(得分:0)

首先,我不认识印度人。根据你已经学过的子主题,解析将是一个更好的选择。然而,对于许多语言,句法分析高度依赖于形态分析。与英语不同,许多语言都有复杂的形态。此外,对于许多语言而言,无论是在三个月内编写解析器还是从头开始编写形态分析器都是不可能的。

因此,如果印度形态不复杂,请选择分析仪。这是NLP的基本水平,你会学到很多东西。如果它相当困难,并且有足够的分析器可以用于解析项目,那就去解析器。

最后,您要么选择解析器或分析器,减少目标或项目并按时完成。例如,尝试编写仅适用于屈折后缀的分析器,而不是尝试编写完整的分析器。

那么一个词干器呢?