机器学习-功能包含值列表

时间:2020-05-06 02:30:57

标签: machine-learning dataset data-cleaning data-processing

我有一个包含许多功能的数据集。我有一个功能,其中包含一个数据点中的值列表。可能是这样的:

A B C
1 2 [3,4,5]

那么我们该如何处理推荐系统的功能C?我知道一种热编码,但是我的特征C没有有限值。 C包含其他ID号,因此它的超时时间会越来越大。是否有解决此类功能的解决方案?

1 个答案:

答案 0 :(得分:0)

根据您的描述以及自从您提到的推荐系统以来,我将您的数据集视为以下示例: 每行是一个用户,特征A,特征B是用户的个人信息,特征C是他购买的商品。当然,功能C在每一行中不包含相同数量的项目,并且可以扩展。

我将建立两个不同的推荐模型,然后将它们组合在一起。一个用于特征A,B,另一个用于特征C。 由于功能部件C随着时间的推移而发展,因此您可以在固定的时间基础上构建模型(拍摄功能部件C的快照),或者只要某些“事件”触发了构建过程即可。在我的示例中,功能部件C是用户项目矩阵。