导入文件时,它会将其读取为CSV并将数据弄为

时间:2018-01-23 20:59:28

标签: parquet h2o sparkling-water

使用Spark2运行sparkling-shell(尝试版本2.2.2 - 2.2.6)(在Linux 7.2下的CDH 5.13下)。 CSV和ZIP文件导入正常,但是当我尝试导入Parquet文件时,它会将其读取为CSV并将数据弄乱。

有人有什么建议吗?

香卡

1 个答案:

答案 0 :(得分:0)

苏打水2.2.7似乎效果更好。然而,它正在寻找" h20.jar"解析器的文件。所以,安装了最新版本的h2o,然后修改了" sparkling-shell"脚本在启动spark-shell时包含h2o.jar文件。

香卡。