我在训练SyntaxNet POS标记器和解析器训练时遇到了一些困难,我可以找到一个很好的解决方案,我在Answers部分解决了这个问题。如果您遇到以下问题之一,documentation确实对您有所帮助:
.conllu
,我不知道如何将格式更改为.conll
文件,并且在我找到{之后} {1}}和conllu-formconvert.py
我仍然没有关于如何使用它们的线索。如果您遇到这样的问题,documentation会有一个名为convert.py
的python文件,该文件在train.sh
和conllu_to_conllx.pl
的主体中调用,以将下载的数据集转换为可读文件for SyntaxNet。parser_trainer_test.sh
上失败然后它在[train_p.sh][5]
test.log
中给了我这个错误:{{ 1}} 文档拆分列车POS标记器和PARSER,并展示了如何在path to save model cannot be found : --model_path=$TMP_DIR/brain_parser/greedy/$PARAMS/ model
和parser_trainer
中使用不同的目录。即使您不想自己使用document,也可以根据该文件更新文件。
3.对我来说,训练解析器花了一天时间,所以不要惊慌需要时间"如果你不使用使用gpu服务器"说disinex
答案 0 :(得分:4)
我从github Disindex得到了一个答案,我发现它非常有用。 https://github.com/dsindex/syntaxnet中的文档包括:
convert_corpus
train_pos_tagger
preprocess_with_tagger
正如Disindex所说的那样,我引用:“我以为你想培训pos-tagger。如果那样的话,请运行./train.sh
”