findAssoc应该返回“一个命名列表。每个列表组件都以术语命名并包含一个命名数字向量。”这是一个简单的例子:
txt <- c("alpha bravo", "alpha charlie", "alpha charlie", "zulu")
corp <- Corpus(VectorSource(txt))
dtm <- DocumentTermMatrix(corp)
x <- findAssocs(dtm, "alpha", .01)
print(x)
alpha
charlie 0.58
bravo 0.33
str(x)
num [1:2, 1] 0.58 0.33
- attr(*, "dimnames")=List of 2
..$ : chr [1:2] "charlie" "bravo"
..$ : chr "alpha"
然而,对于某些单个匹配,它返回一个向量,并连接单词,用句点分隔:
y <- findAssocs(dtm, "charlie", .01)
print(y)
charlie.alpha
0.58
str(y)
Named num 0.58
- attr(*, "names")= chr "charlie.alpha"
这使处理结果变得困难;我可以解决这个问题,但这是预期的行为还是我应该向维护者提交的错误?