管道拟合上的pyspark scala.MatchError

时间:2019-11-20 23:57:10

标签: apache-spark machine-learning pyspark databricks pyspark-dataframes

我正在尝试在Databricks上训练我的模型。我的训练数据包括idtextlabel。但是当我尝试在Databricks上运行脚本时,我遇到了

scala.MatchError: [null,1.0,(262144,[143985],[1.0])] (of class org.apache.spark.sql.catalyst.expressions.GenericRowWithSchema) 当我做model = pipeline.fit(training)时。

我是pyspark的初学者,我怀疑某个地方的数据类型不匹配,但是我无法深入研究并解决问题。 如果有人可以提供帮助,我将感到非常高兴。这是我的code

0 个答案:

没有答案