推荐拆分返回空数据集

时间:2018-06-20 18:24:48

标签: azure-machine-learning-studio

我正在使用设置为推荐者拆分的“拆分数据”模块来拆分数据,以训练和测试火柴盒推荐器。输入数据是一个有效的用户项目评分元组(例如575978-157381-3),除了将其更改为.75和之外,我保留了默认值(默认为0)的推荐值拆分参数。 25分。但是,此模块完成后,它将为数据集1返回完整的,未拆分的数据集,并为数据集2返回完全为空(但带有标签)的数据集。使用“拆分行”模式进行分层拆分时,也会发生这种情况。知道发生了什么事吗?

谢谢。

编辑:包括我的数据样本。

UserID  ItemID  Rating
835793  165937  3
154738  11214   3
938459  748288  3
819375  789768  6
738571  98987   3
847509  153777  3
991757  124458  3
968685  288070  2
236349  8337    3
127299  545885  3

1 个答案:

答案 0 :(得分:0)

弄清楚了。在我的“删除重复行”模块中,我只是通过UserID而不是UserID ItemID删除重复项。这仍然留下了很多行,但是我假设它与分层混淆了。