有没有一种比TfidfVectorizer更好的方法来处理数字功能列表?

时间:2019-03-02 08:59:38

标签: python scikit-learn

我有一组包含许多属性的项目,每个项目的属性都分组为一个数字列表:

              year     attributes_1,       attributes_2
item_id
199884477     2002     986,977,938,999     888,832,838,822
199884478     1998     986,977,911         832,888,838,822
199884479     2000     999,977,944         866,855
...
199884499     2001     938,911,987         822,800

我应如何提取attributes_1attributes_2中的特征以进行 Content-Based Filtering 并计算对象的相似度 ,然后结合attributes_1attributes_2点吗?

0 个答案:

没有答案