我想使用R的“介绍tm包”中描述的synonyms()来使用wordnet包。从CRAN下载的wordnet包在其目录中没有Dict(字典)。我从普林斯顿网站下载并将其复制到目录中。使用sys.setenv()
和setDict()
设置路径后,我仍然收到此错误:
Error in sort(unique(unlist(lapply(synsets, getWord))))
error in evaluating the argument 'x' in selecting a method for function 'sort': Error in unique(unlist(lapply(synsets, getWord))) :
error in evaluating the argument 'x' in selecting a method for function 'unique': Error in .jcall(synset, "Ljava/util/List;", "getWord") :
java.lang.NumberFormatException: For input string: "t"
当我尝试synonyms("company", pos = "NOUN")
或其他英文单词代替'company'时。问题出在getSynonyms()
来自synonyms()
。关于如何解决这个问题的任何想法?
不同的组合会导致不同的输入字符串NumberFormatException。我的Java是1.8版。我尝试了所有的在线资源。我为R的bin和RJava的jri添加了两条PATH路径。对异常的讨论表明它是一个字符串到数字转换问题。我确保Java到R链接(通过rJava)工作(URL:https://www.rforge.net/rJava/)。