我有一组包含许多属性的项目,每个项目的属性都分组为一个数字列表:
year attributes_1, attributes_2 item_id 199884477 2002 986,977,938,999 888,832,838,822 199884478 1998 986,977,911 832,888,838,822 199884479 2000 999,977,944 866,855 ... 199884499 2001 938,911,987 822,800
我应如何提取attributes_1
和attributes_2
中的特征以进行 Content-Based Filtering
并计算对象的相似度 ,然后结合attributes_1
和attributes_2
点吗?