我使用quanteda,一个用于管理和分析文本的R包。我的一个核心功能遇到了麻烦:" dfm"用于构建文档频率矩阵。
运行功能
List<Object> row = tableData.get(rowIndex); //NPE means tableData is null
row.set(columnIndex, value); //NPE means inner List is null
返回了代码和错误
# Install packages
packages <- function(x){
x <- as.character(match.call()[[2]])
if (!require(x,character.only=TRUE)){
install.packages(pkgs=x,repos="http://cran.r-project.org")
require(x,character.only=TRUE)
}
}
packages("XML")
packages("textcat")
packages("tm")
packages("RTextTools")
packages("stringi")
packages("proxy")
packages("cluster")
packages("topicmodels")
packages("dplyr")
packages("plyr")
packages("stringr")
packages("quanteda")
packages("ggplot2")
packages("RWeka")
# Build textfile using 2nd field text for analysis
txt <- textfile("myfile.csv",textField = 2)
# Build object of class corpus from txt
MyCorpus <- corpus(txt)
# Construct a document-frequency matrix
myDfm <- dfm(MyCorpus)
正如您所看到的,该功能正在运行,但在#34;构建稀疏矩阵&#34;之后就会卡住。我不明白这个错误或如何处理它。有什么建议吗?
答案 0 :(得分:1)
我找到了简单的解决方案:从R版本3.1.2更改为3.2.2