Treetagger koRpus包错误

时间:2016-03-28 07:24:29

标签: r text analysis korpus

我正在尝试在koRpus包中使用Treetag函数。 我使用的代码是

tagged.text <-treetag("C:/Rec_By_Others.txt",treetagger="manual",lang="en",TT.options=list(path="C:\\Program Files\\TreeTagger", preset="en"))

但我一直遇到以下错误。

Error in matrix(unlist(strsplit(tagged.text, "\t")), ncol = 3, byrow = TRUE,  : 
  'data' must be of a vector type, was 'NULL'

我该怎么办?

1 个答案:

答案 0 :(得分:0)

您的代码对我来说似乎是对的,但我有相同的错误消息。直到今天我才找到解决这个问题的方法。我终于发现我的PERL安装有问题,所以我重新安装了新版本的PERL。然后,我通过应用README TreeTagger指令检查TreeTagger是否正常工作,即:

安装

  1. 安装Perl解释器(如果尚未安装)。您可以在http://www.activestate.com/activeperl/
  2. 免费下载适用于Windows的Perl解释程序
  3. 解压缩zip文件(如果尚未解压缩)并将TreeTagger目录移动到驱动器C的根目录:。
  4. 下载所需语言的参数文件,解压缩(例如使用Winzip或7zip)并将其移动到子目录TreeTagger / lib。将参数文件重命名为-utf8.par示例:将french-par-linux-3.2-utf8.bin重命名为french-utf8.par不再支持非UTF8参数文件。
  5. 将路径C:\ TreeTagger \ bin添加到PATH环境变量中。必要的步骤因Windows版本而异。
  6. 打开命令提示符窗口并键入命令set PATH = C:\ TreeTagger \ bin;%PATH%
  7. 转到目录C:\ TreeTagger cd c:\ TreeTagger
  8. 现在您可以测试标记器,例如通过使用命令标记分析此文件-english INSTALL.txt如果将TreeTagger安装在其他目录中,则必须使用Wordpad等编辑器修改批处理文件标记中的第一个路径 - * .bat。
  9. 另请注意: 如果您将TreeTagger安装在其他目录中,则必须执行此操作 使用编辑器修改批处理文件tag- .bat中的第一个路径 例如Wordpad。

    我希望这有帮助。