标签: recommender-systems
我正在评估4个非常大的数据集的推荐系统中的两个回归变量,如图所示,它们在RMSE方面的差异很小。
RMSE values
我进行了10倍交叉验证,并使用t型学生测试分析了实验,发现p值<0.01时具有统计学意义。尽管统计检验表明它们有所不同,但我对两次实验之间的小幅下降感到不满意。
有人对结果是否确实有意义有见识吗?测试集的大小是否会影响RMSE差异的大小?