斯坦福Tagger与盖茨

时间:2014-01-18 16:55:13

标签: stanford-nlp gate

我在Linux下使用GATE for Arabic,使用Stanford Tagger时没有任何POS标签。所有参数都没有更改(默认情况下)我可以做什么来执行该任务? 这个问题是否取决于参数?必须在taggerBinary参数中设置标记器的哪个安装目录?

1 个答案:

答案 0 :(得分:1)

首先,您必须在GATE中创建一个新的StanfordPOSTaggerPR,并使用随StanfordTagger提供的arabic.tagger模型初始化Tagger。

GATE的最后一个版本是8.0,它使用StanfordTagger 3.4。因此,您必须下载此版本提供的型号。

enter image description here

接下来,您必须使用SentenceSplitter和Tokeniser创建一个语料库管道(我已尝试使用UnicodeTokeniserRegExp SentenceSplitter):

enter image description here

最后,使用示例文件尝试管道:

enter image description here