解释scala中多项LogisticRegressionWithLBFGS模型输出中的系数

时间:2016-03-18 09:05:32

标签: scala regression apache-spark-mllib multinomial

我正在尝试对多项LogisticRegressionWithLBFGS模型的输出进行一些后处理。模型矩阵在R中创建,然后导出到scala spark以进行模型拟合。

documentation表示存在"标准特征缩放和L2正规化"。来自R {'1}}包中的multinom()函数的多项模型的输出清楚地表示为给定结果和基本结果之间的对数概率。然而,文档中没有足够详细的信息来说明如何转换LogisticRegressionWithLBFGS的权重以获得一组标准系数。

术语"标准特征缩放"对不同的人意味着不同的东西。这可能意味着模型矩阵被缩放为(x - mean(x))/ sd(x)或(x - min(x))/(max(x) - min(x))或一组其他可能性。此外,权重输出是一串数字,这些数字是可以以不同方式折叠以获得系数矩阵的特征的倍数 - 例如按行,按列或其他任意方式。

如何处理LogisticRegressionWithLBFGS()。权重的输出以获得一组标准系数,我可以使用原始模型矩阵进行一些后处理,基本推理和预测?

0 个答案:

没有答案