Treetaggerwrapper python中的无效参数文件

时间:2018-12-04 09:06:31

标签: python parsing installation pos

我已经通过PyPI为Python安装了TreeTaggerwrapper。我已经将treetaggerwrapper.py和treetaggerpoll.py放置在Treetagger目录中。我也将english.par文件放在“ lib”子目录中。当我启动标记对象时,出现以下错误。

tagger= treetaggerwrapper.TreeTagger(TAGLANG='en')
----> 1 tagger= treetaggerwrapper.TreeTagger(TAGLANG='en')

c:\users\kj\appdata\local\programs\python\python36\lib\site-packages\treetaggerwrapper.py in __init__(self, **kargs)
   1000         logger.debug("Using treetaggerwrapper.py from %s", osp.abspath(__file__))
   1001         self._set_language(kargs)
-> 1002         self._set_tagger(kargs)
   1003         self._set_preprocessor(kargs)
   1004         # Note: TreeTagger process is started later, when really needed.

c:\users\kj\appdata\local\programs\python\python36\lib\site-packages\treetaggerwrapper.py in _set_tagger(self, kargs)
   1087                              self.tagparfile)
   1088                 raise TreeTaggerError("TreeTagger parameter file invalid: " + \
-> 1089                                       self.tagparfile)
   1090         logger.info("tagparfile=%s", self.tagparfile)
   1091 

TreeTaggerError: TreeTagger parameter file invalid: english-utf8.par

当我使用“ tag-english”从cmd访问树标记器时,我正在获取输出。有人可以指出这里有什么问题吗?我已将treetagger目录添加到PATH。'

1 个答案:

答案 0 :(得分:0)

前几天我遇到了同样的问题。 显然,treetaggerwrapper希望参数文件具有类似于english-utf8.par的名称。但是,如果您仅提取了从TreeTagger下载的参数文件,而后又没有对其进行修改,则它们很可能被称为english.par。

您可以在代码中更改期望的文件名,也可以更改参数文件的名称以匹配代码。 (参数文件应该已经在utf8中进行了编码,因此您无需更改编码,只需更改名称即可)