我已经通过PyPI为Python安装了TreeTaggerwrapper。我已经将treetaggerwrapper.py和treetaggerpoll.py放置在Treetagger目录中。我也将english.par文件放在“ lib”子目录中。当我启动标记对象时,出现以下错误。
tagger= treetaggerwrapper.TreeTagger(TAGLANG='en')
----> 1 tagger= treetaggerwrapper.TreeTagger(TAGLANG='en')
c:\users\kj\appdata\local\programs\python\python36\lib\site-packages\treetaggerwrapper.py in __init__(self, **kargs)
1000 logger.debug("Using treetaggerwrapper.py from %s", osp.abspath(__file__))
1001 self._set_language(kargs)
-> 1002 self._set_tagger(kargs)
1003 self._set_preprocessor(kargs)
1004 # Note: TreeTagger process is started later, when really needed.
c:\users\kj\appdata\local\programs\python\python36\lib\site-packages\treetaggerwrapper.py in _set_tagger(self, kargs)
1087 self.tagparfile)
1088 raise TreeTaggerError("TreeTagger parameter file invalid: " + \
-> 1089 self.tagparfile)
1090 logger.info("tagparfile=%s", self.tagparfile)
1091
TreeTaggerError: TreeTagger parameter file invalid: english-utf8.par
当我使用“ tag-english”从cmd访问树标记器时,我正在获取输出。有人可以指出这里有什么问题吗?我已将treetagger目录添加到PATH。'
答案 0 :(得分:0)
前几天我遇到了同样的问题。 显然,treetaggerwrapper希望参数文件具有类似于english-utf8.par的名称。但是,如果您仅提取了从TreeTagger下载的参数文件,而后又没有对其进行修改,则它们很可能被称为english.par。
您可以在代码中更改期望的文件名,也可以更改参数文件的名称以匹配代码。 (参数文件应该已经在utf8中进行了编码,因此您无需更改编码,只需更改名称即可)