如何使用Spark使用GeneralizedLinearRegression模型从预测中获取概率

时间:2016-11-03 12:13:36

标签: scala apache-spark logistic-regression

我是机器学习的新手,我试图使用spark实现GeneralizedLinearRegression模型的二项式族。

我试过了,

val trainingData = sparkSession.read.format("libsvm").load("trainingData.txt")
val testData = sparkSession.read.format("libsvm").load("testData.txt") 
val glr = new GeneralizedLinearRegression().setFamily("binomial").setLink("logit").setRegParam(0.3).setMaxIter(10)
val glrModel = glr.fit(trainingData)
model.transform(testData).show()

对于我的testData,我的预测值为1.0E-16。当我使用LogisticRegression时,它会给出概率(0.765394663)和预测值(0.0)。

我想知道,

  1. 如何使用预测值中的GeneralizedLinearRegression预测类。我应该使用阈值从预测值中找到类吗?
  2. 如何找到预测值的概率?

0 个答案:

没有答案