标签: r tm
我正在使用R包在tm中进行一些文本挖掘。我熟悉weightTfIdf作为加权选项:
R
tm
weightTfIdf
dtm <- DocumentTermMatrix(docs, control = list(dictionary = c("argument"), weighting = weightTfIdf))
然而,我所处理的所有文件都包含我正在寻找的术语,但仅限于不同程度 - 因此TfIdf不起作用。如何按文件长度加权TermDocumentMatrix?
TermDocumentMatrix