我在Linux下使用GATE for Arabic,使用Stanford Tagger时没有任何POS标签。所有参数都没有更改(默认情况下)我可以做什么来执行该任务? 这个问题是否取决于参数?必须在taggerBinary参数中设置标记器的哪个安装目录?
答案 0 :(得分:1)
首先,您必须在GATE中创建一个新的StanfordPOSTaggerPR,并使用随StanfordTagger提供的arabic.tagger
模型初始化Tagger。
GATE的最后一个版本是8.0,它使用StanfordTagger 3.4。因此,您必须下载此版本提供的型号。
接下来,您必须使用SentenceSplitter和Tokeniser创建一个语料库管道(我已尝试使用UnicodeTokeniser
和RegExp SentenceSplitter
):
最后,使用示例文件尝试管道: