LightFM和其他库要求用户提供32位整数id。但是,我们的用户ID是UUID,例如0003374a-a35c-46ed-96d2-0ea32b753199
。我想知道你会在这些场景中推荐什么。我想出的是:
xxhash
获得了大约11,521或0.1%的碰撞。推荐系统可以忽略不计吗?我也很好奇这将如何应用于在线预测场景,在给定UUID,用户交互和模型的情况下,我必须预测需要32位整数的模型的建议。如果我使用in memory bidict方法,那么在这种情况下这将不起作用,因此我可能必须在最坏的情况下创建一个持久的键值存储。
答案 0 :(得分:2)
在LightFM以及大多数其他实施方案中,只能针对培训期间出现的用户和项目(或至少针对用户和项目功能)进行推荐。然后,映射将成为模型本身的一部分,并有效地冻结,直到训练新模型为止。