tm中的findAssoc返回不一致

时间:2015-06-26 17:59:02

标签: r tm

findAssoc应该返回“一个命名列表。每个列表组件都以术语命名并包含一个命名数字向量。”这是一个简单的例子:

txt  <- c("alpha bravo", "alpha charlie", "alpha charlie", "zulu")
corp <- Corpus(VectorSource(txt))
dtm  <- DocumentTermMatrix(corp)
x    <- findAssocs(dtm, "alpha", .01)
print(x)
        alpha
charlie  0.58
bravo    0.33

str(x)
 num [1:2, 1] 0.58 0.33
 - attr(*, "dimnames")=List of 2
  ..$ : chr [1:2] "charlie" "bravo"
  ..$ : chr "alpha"

然而,对于某些单个匹配,它返回一个向量,并连接单词,用句点分隔:

y <- findAssocs(dtm, "charlie", .01)
print(y)
charlie.alpha 
         0.58
str(y)
Named num 0.58
 - attr(*, "names")= chr "charlie.alpha"

这使处理结果变得困难;我可以解决这个问题,但这是预期的行为还是我应该向维护者提交的错误?

0 个答案:

没有答案