门/ Jape用西班牙语

时间:2013-08-09 09:57:14

标签: nlp gate

我在许多网站上看过,他们说Gate支持西班牙语,但我没有找到如何用Gate分析西班牙语文本。我尝试使用treetagger,但我收到错误:TreeTagger \ tree-tagger-spanish-gate“:CreateProcess error = 193,%1 no esunaplalicaciónWin32válida

我也试过OpenNLP,但我找不到西班牙语(tokenizer,chunk等)的模型我只找到了荷兰语,德语和英语。

此外,我需要识别句子和谓词的主语。纠正我,如果我错了,但我认为我可以用OpenNLP来做,因为可以用树库解析器或MuNPEx插件识别NP(名词短语)和VP(动词短语)。

Summering,有没有办法将Gate语言设置为西班牙语?

感谢。

1 个答案:

答案 0 :(得分:3)

您需要Cygwin才能在Windows上运行treetagger脚本。错误消息

  

CreateProcess error = 193,%1 no esunaplalicaciónWin32válida

向我建议您没有将shell.path系统属性设置为指向您的Cygwin sh.exe,如TaggerFramework section of the user guide中所述。

对于OpenNLP,http://opennlp.sourceforge.net/models-1.5/处有一些名称查找器模型,https://github.com/utcompling/OpenNLP-Models/tree/master/models/es处有POS标记器模型,但我无法在任何地方看到tokeniser或chunker模型。对于标记化和句子分割,我怀疑默认的GATE Unicode标记符(不是“ANNIE英语标记符”)和任何一个默认的句子分割符都能完成合理的工作。

可能值得订阅gate-users mailing list并在那里询问是否有其他人拥有他们愿意分享的任何西班牙资源。