在SytaxNet中训练SyntaxNet POS Tagger

时间:2016-06-02 18:14:43

标签: syntaxnet

我在训练SyntaxNet POS标记器和解析器训练时遇到了一些困难,我可以找到一个很好的解决方案,我在Answers部分解决了这个问题。如果您遇到以下问题之一,documentation确实对您有所帮助:

  1. Universal Dependencies引入的培训,测试和调整数据集格式为.conllu,我不知道如何将格式更改为.conll文件,并且在我找到{之后} {1}}和conllu-formconvert.py我仍然没有关于如何使用它们的线索。如果您遇到这样的问题,documentation会有一个名为convert.py的python文件,该文件在train.shconllu_to_conllx.pl的主体中调用,以将下载的数据集转换为可读文件for SyntaxNet。
  2. 每当我运行bazel测试时,我被告知在stackoverflow question and answer之一上运行bazel测试,在parser_trainer_test.sh上失败然后它在[train_p.sh][5] test.log中给了我这个错误:{{ 1}}
  3. 文档拆分列车POS标记器和PARSER,并展示了如何在path to save model cannot be found : --model_path=$TMP_DIR/brain_parser/greedy/$PARAMS/ modelparser_trainer中使用不同的目录。即使您不想自己使用document,也可以根据该文件更新文件。 3.对我来说,训练解析器花了一天时间,所以不要惊慌需要时间"如果你不使用使用gpu服务器"说disinex

1 个答案:

答案 0 :(得分:4)

我从github Disindex得到了一个答案,我发现它非常有用。 https://github.com/dsindex/syntaxnet中的文档包括:

convert_corpus
train_pos_tagger
preprocess_with_tagger

正如Disindex所说的那样,我引用:“我以为你想培训pos-tagger。如果那样的话,请运行./train.sh