每次运行Myrrix时,我的结果会略有不同,即使我给它的输入完全相同。 (我只运行服务层。)
这是预期的行为,如果是这样,我可以预期结果会有多大变化?
我自发的猜测是,Myrrix使用的算法本质上是不确定的,因为它是为大规模并行化而构建的 - 这是一个正确的评估吗?
答案 0 :(得分:1)
它与并行性无关,而与算法的随机初始条件无关。您每次都会看到略有不同的解决方案。虽然这是正常的,但它们不应该太不同。如果是,则表示过度拟合:您的数据集可能有很多功能或低lambda。我的第一个猜测是你的数据集相当小,相比之下默认的30个功能相当大。