我想使用UDPipe软件(http://ufal.mff.cuni.cz/udpipe)标记多个文本文件。
我已经下载了UDPipe二进制软件包,设法安装了所有依赖项,并且按照安装手册(http://ufal.mff.cuni.cz/udpipe/install)的说明在make
文件夹中运行了src
,并试图运行“最常见的” UDPipe命令,即:
udpipe --tokenize --tag --parse udpipe_model
。
为此,我已经下载了俄语模型(https://lindat.mff.cuni.cz/repository/xmlui/handle/11234/1-2898)并使用了这样的逗号:
./udpipe --tokenize --tag --parse russian-syntagrus-ud-2.3-181115.udpipe test_input/*.txt
。
我不得不说UDPipe用户手册不是面向新手的(是的,我是新手),我什至不知道是否使用'* .txt'作为输入文件甚至有可能。但是,以上命令返回了此消息:
正在加载UDPipe模型:无法加载UDPipe模型'russian-syntagrus-ud-2.3-181115.udpipe'!
完全接收到任何消息都给了我一个提示,该命令可能是正确的,但是该软件包可能有问题,或者很有可能是我使用它的方式。任何帮助,将不胜感激。如果我尝试使用使用特定语言模型标记多个文本的命令不正确,请向我展示使用此软件的正确方法。
我正在运行Debian 9(拉伸)。