解释MLLib的线性回归o / p

时间:2014-12-20 16:23:27

标签: apache-spark apache-spark-mllib

我使用LIBSVM格式来指定我的输入要素向量,该向量使用从1开始的索引。当我运行回归时,o / p是基于0索引的。我有一个主查找文件,将这些索引映射回他们的立场或。但是,我需要在映射期间为回归结果添加2而不是1的偏移量。因此,例如,为了从回归输出文件映射800索引,我在主查找文件中查找802,然后事情才有意义。我可以理解添加偏移量为1,但不确定为什么添加偏移量2工作正常。还有其他人看起来像这样吗?

1 个答案:

答案 0 :(得分:1)

LIBSVM输入格式基于1。但是,在回归结束时得到的系数/权重只与您拥有的要素总数相匹配,两者之间存在1对1的对应关系。