如何为UDPipe使用特定的语言模型

时间:2019-02-04 18:02:33

标签: pos-tagger debian-stretch udpipe

我想使用UDPipe软件(http://ufal.mff.cuni.cz/udpipe)标记多个文本文件。

我已经下载了UDPipe二进制软件包,设法安装了所有依赖项,并且按照安装手册(http://ufal.mff.cuni.cz/udpipe/install)的说明在make文件夹中运行了src,并试图运行“最常见的” UDPipe命令,即:

udpipe --tokenize --tag --parse udpipe_model

为此,我已经下载了俄语模型(https://lindat.mff.cuni.cz/repository/xmlui/handle/11234/1-2898)并使用了这样的逗号:

./udpipe --tokenize --tag --parse russian-syntagrus-ud-2.3-181115.udpipe test_input/*.txt

我不得不说UDPipe用户手册不是面向新手的(是的,我是新手),我什至不知道是否使用'* .txt'作为输入文件甚至有可能。但是,以上命令返回了此消息:

  

正在加载UDPipe模型:无法加载UDPipe模型'russian-syntagrus-ud-2.3-181115.udpipe'!

完全接收到任何消息都给了我一个提示,该命令可能是正确的,但是该软件包可能有问题,或者很有可能是我使用它的方式。任何帮助,将不胜感激。如果我尝试使用使用特定语言模型标记多个文本的命令不正确,请向我展示使用此软件的正确方法。

我正在运行Debian 9(拉伸)。

0 个答案:

没有答案