需要统计自然语言处理的资源

时间:2011-08-23 22:33:06

标签: java statistics nlp

我正在用Java编写一个需要解析自然语言的程序。我需要使用概率和统计数据完成此操作。是否有任何资源可以轻松解释统计自然语言处理技术?

1 个答案:

答案 0 :(得分:8)

Manning& Co.的一个常用的“介绍性”参考文献是Foundations of Statistical Natural Language Processing(1999)。 Shutze。虽然全面,相对容易获得并且肯定是一个很好的参考,但对于该领域的更为随意的介绍,这可能是过度的。

您可以找到一些在线课程,例如 Short course on Statistical Methods in NLP

而且,既然你提到了java,你可以找到一个通用的“工具箱”,比如

开始亲自接触NLP的特定区域,例如POS标记或实体提取。
另外值得一提的是,虽然它与基于Python的NLTK有关,Natural Language Processing with Python online (and hardcopy) book构成了常见NLP任务的非常实用的指南。

在NLP中有一点点让人感到困惑:这是一个相当广泛的研究和实践领域。它充满了学术研究和时间和行业测试的实践和图书馆。在人们更好地掌握适用于特定问题的NLP的特定应用之前,人们可能会花费大量时间来寻找不成熟或不太适合手头问题的技术。