我有一个来自youtube评论的术语文档矩阵
约977份文件
使用以下方法创建了一个术语文档矩阵:
dtm <- DocumentTermMatrix(doc_corpus)
然后应用函数
findAssocs(dtm,"hello", 0.6)
得到以下内容(翻译自法语)
Error in which (x [term],> corlimit): index out of bounds
所有其他功能都像findFreqTerms和hclus等一样工作
答案 0 :(得分:2)
您收到错误,因为术语集中不存在该词。您可以使用以下方式检查:
'hello' %in% Terms(dtm)
应返回FALSE。