标签: r nlp text-mining tf-idf
我有这种含糊。 我有一个包含多列分类数据的数据集,我的考虑是应用tf-idf(字符串嵌入)。 我主要担心的是,是否可以分别为每一列完成编码,还是应该将编码应用于一个列,这将是其他列作为文本文档的合并。
tf-idf只是一个例子,问题代表文本编码的一般情况。
谢谢