我正在尝试使用Apache spark和scala构建比特币价格的预测模型。我已经预处理了数据并构建了以下格式:
我使用线性回归来执行灭绝。
val scaler = new StandardScaler(withMean = true, withStd = true)
.fit(parsedData.map(x => x.features))
val scaledData = parsedData
.map(x =>
LabeledPoint(x.label,
scaler.transform(Vectors.dense(x.features.toArray))))
val splits = scaledData.randomSplit(Array(0.8, 0.2), seed = 11L)
val training = splits(0).cache()
val test = splits(1)
// Building the model
val numIterations = 100
val step = 0.1
val algorithm = new LinearRegressionWithSGD()
algorithm.setIntercept(true)
algorithm.optimizer
.setNumIterations(numIterations)
.setStepSize(step)
.setRegParam(0.001)
.setUpdater(updater)
我得到的预测没有正确计算。它给了我非常随机的预测。
有人可以帮帮我吗?当我使用Azure ML库进行预测时,相同的数据集工作正常。