我是否可以在创建tm::TermDocumentMatrix
对象时删除稀疏术语?
我试过了:
TermDocumentMatrix(file.corp, control = list(removeSparseTerms=0.998))
但它不起作用。
答案 0 :(得分:1)
不,您无法使用TermDocumentMatrix
功能删除稀疏术语。如果您使用?TermDocumentMatrix
检查该功能的帮助,您会看到control
的帮助列在termFreq
的帮助中,当您查看该功能的帮助时?termFreq
,您会看到removeSparseTerms
未列在那里。虽然你有bounds
可以做相关的工作。
如果你只想要一个结合了TermDocumentMatrix
和removeSparseTerms
的单行,你只需将你的内线翻转出来,这样就可以了:
removeSparseTerms(TermDocumentMatrix(file.corp), 0.998)
我建议您仔细查看tm
包的文档,这是一个记录良好的贡献包的更好示例之一。这可能会节省您等待某人在此回答您问题的时间!