我使用 tm 包有一个语料库变量 df_tdm ,如下所示:
> df_tdm
<<TermDocumentMatrix (terms: 214552, documents: 1)>>
Non-/sparse entries: 214552/0
Sparsity : 0%
Maximal term length: 126
Weighting : term frequency (tf)
当我使用findAssocs函数查找与类相关的单词时,它返回 numeric(0)而不是相关单词的矩阵。为什么会这样。
> findAssocs(df_tdm, "like", .1)
$like
numeric(0)
答案 0 :(得分:0)
函数findAssoc中的最后一个参数是输出术语所需的最小相关性。 示例中的空输出可能是由于阈值的值。尝试较低的值,它应该工作。