我的线性回归代码在pyspark中运行良好,没有错误。 您可以看到我的代码:
(training, test) = new_data.randomSplit([.7, .3])
InputCol=features.columns
vectorAssembler = VectorAssembler(inputCols=InputCol, outputCol="unscaled_features")
standardScaler = StandardScaler(inputCol="unscaled_features", outputCol="features")
lr = LinearRegression(maxIter=10, regParam=.01)
stages = [vectorAssembler, standardScaler, lr]
pipeline = Pipeline(stages=stages)
model = pipeline.fit(training)
prediction = model.transform(test)
现在,我想使用:
查看模型的预测prediction.show()
但是,看看我能得到什么
为什么我会得到这样的结果?以及如何获取这样的结果表: