标签: recommender-systems
我正在处理一个电子商务用户日志数据。我正在尝试建立排名模型。数据集具有用户ID,商品ID,类别ID,时间戳,操作(“购买”或“ PV”)。目的是预测动作将被“购买”的可能性。 我对如何处理这些id类型的功能迷失了。它们显然是分类特征。在进行学校级项目时,我总是使用单点编码。我不知道编码方法是否适合该项目。有很多用户。如果一键编码用户ID,我认为模型将简单粗略地记住每个用户对哪些项目感兴趣。听起来不对。 有经验的人会向我解释如何处理这些功能吗?