"无效的类“dfmSparse”对象"在quanteda R包中运行dfm函数时出错

时间:2016-06-08 13:01:12

标签: r text-analysis quanteda

我使用quanteda,一个用于管理和分析文本的R包。我的一个核心功能遇到了麻烦:" dfm"用于构建文档频率矩阵。

运行功能

List<Object> row = tableData.get(rowIndex); //NPE means tableData is null
row.set(columnIndex, value); //NPE means inner List is null

返回了代码和错误

# Install packages
packages <- function(x){
  x <- as.character(match.call()[[2]])
  if (!require(x,character.only=TRUE)){
    install.packages(pkgs=x,repos="http://cran.r-project.org")
    require(x,character.only=TRUE)
  }
}

packages("XML")
packages("textcat")
packages("tm")
packages("RTextTools")
packages("stringi")
packages("proxy")
packages("cluster")
packages("topicmodels")
packages("dplyr")
packages("plyr")
packages("stringr")
packages("quanteda")
packages("ggplot2")
packages("RWeka")

# Build textfile using 2nd field text for analysis
txt <- textfile("myfile.csv",textField = 2)

# Build object of class corpus from txt
MyCorpus <- corpus(txt)

# Construct a document-frequency matrix
myDfm <- dfm(MyCorpus)

正如您所看到的,该功能正在运行,但在#34;构建稀疏矩阵&#34;之后就会卡住。我不明白这个错误或如何处理它。有什么建议吗?

1 个答案:

答案 0 :(得分:1)

我找到了简单的解决方案:从R版本3.1.2更改为3.2.2