向量化文件时的多种功能

时间:2019-06-18 04:46:19

标签: recommender-systems

我正在构建用于对面试问题进行编码的推荐系统。

我现在拥有的数据包含问题名称,问题内容,​​问题主题和难度。

我知道如何使用此数据制作特征向量的最基本方法是在问题内容上使用TF-IDF并计算所有问题之间的相似度。但是,我也想在特征向量中包括问题主题和难度。

包含这些内容的好方法是什么?

当我只使用TF-IDF时,每行的大小为(1 x整个文档中的单词数)。

0 个答案:

没有答案