我正在使用设置为推荐者拆分的“拆分数据”模块来拆分数据,以训练和测试火柴盒推荐器。输入数据是一个有效的用户项目评分元组(例如575978-157381-3),除了将其更改为.75和之外,我保留了默认值(默认为0)的推荐值拆分参数。 25分。但是,此模块完成后,它将为数据集1返回完整的,未拆分的数据集,并为数据集2返回完全为空(但带有标签)的数据集。使用“拆分行”模式进行分层拆分时,也会发生这种情况。知道发生了什么事吗?
谢谢。
编辑:包括我的数据样本。
UserID ItemID Rating
835793 165937 3
154738 11214 3
938459 748288 3
819375 789768 6
738571 98987 3
847509 153777 3
991757 124458 3
968685 288070 2
236349 8337 3
127299 545885 3
答案 0 :(得分:0)
弄清楚了。在我的“删除重复行”模块中,我只是通过UserID而不是UserID 和 ItemID删除重复项。这仍然留下了很多行,但是我假设它与分层混淆了。