Spark AnalysisException无法解析给定输入列的“列名”

时间:2017-01-20 21:33:18

标签: scala apache-spark spark-dataframe

我有一个包含列x,y

的DataFrame
x     y
1     false
1     false
1     true
2     true
2     false
3     null
3     true

我尝试使用以下代码创建列联表,并期望得到以下结果:

myDataFrame.stat.crosstab("x", "y")

x_y  true    false     null
1    1       2         0
2    1       1         0
3    1       0         1

但是,我收到以下异常:AnalysisException cannot resolve 'true' given input columns [x, y]

列'true'(以及'false'和'null')由stat.crosstab在运行时自动创建。如果不先对数据进行完全传递,静态分析就无法检测到新的列名。

我正在使用Spark 1.6.1.5。这是一个错误吗?我可以以某种方式禁用分析仪吗?

0 个答案:

没有答案