使用Spark2运行sparkling-shell(尝试版本2.2.2 - 2.2.6)(在Linux 7.2下的CDH 5.13下)。 CSV和ZIP文件导入正常,但是当我尝试导入Parquet文件时,它会将其读取为CSV并将数据弄乱。
有人有什么建议吗?
香卡
答案 0 :(得分:0)
苏打水2.2.7似乎效果更好。然而,它正在寻找" h20.jar"解析器的文件。所以,安装了最新版本的h2o,然后修改了" sparkling-shell"脚本在启动spark-shell时包含h2o.jar文件。
香卡。