我需要创建一些nlp解析器。 任何人都可以告诉我该怎么做?推荐任何文献或网站链接? 或者我的语言是否有任何库(CZECH REPUBLIC - Czech language)? 足以确定主语和谓词。 谢谢。
答案 0 :(得分:2)
创建解析器并非易事。您最好的选择可能是采用现成的统计解析器并在捷克文本的注释语料库上进行训练。使用依赖解析器可能会获得更好的成功。我发现了一些有用的网站:http://ufal.mff.cuni.cz/czech-parsing和http://ufal.mff.cuni.cz/pdt/Corpora/PDT_1.0/Doc/ws98/nlpch1.pdf
对于NLP(包括解析)的一个很好的介绍性文本是Jurafsky和Martin的语音和语言处理。这实际上是NLP的圣经。您还可以查看NLTK(python的自然语言工具包)http://www.nltk.org。它将包含一些解析器,所以也许你可以在布拉格依赖树库上训练它们。