标签: data-mining text-mining
有没有人告诉我如何通过词袋概念将文本文档转换为向量?如何在java中实现向量空间模型?实际上,我已经预处理了文本数据集到词干过程,现在我必须使用词袋概念将这些文本文档转换为矢量化模型。有人帮助我吗?如何在java中实现它?
答案 0 :(得分:0)
建立字典。
为每个单词指定一个唯一的整数索引,即VSM中的维度。