我有一个包含列x,y
的DataFramex y
1 false
1 false
1 true
2 true
2 false
3 null
3 true
我尝试使用以下代码创建列联表,并期望得到以下结果:
myDataFrame.stat.crosstab("x", "y")
x_y true false null
1 1 2 0
2 1 1 0
3 1 0 1
但是,我收到以下异常:AnalysisException cannot resolve 'true' given input columns [x, y]
列'true'(以及'false'和'null')由stat.crosstab
在运行时自动创建。如果不先对数据进行完全传递,静态分析就无法检测到新的列名。
我正在使用Spark 1.6.1.5。这是一个错误吗?我可以以某种方式禁用分析仪吗?