Spark SQL不支持的数据类型TimestampType

时间:2014-10-10 21:03:06

标签: scala apache-spark

我刚接触spark和scala.Trying读取文本文件并保存它的镶木地板文件。对我来说,我使用的字段之一是TimeStamp,其文档说spark1.1.0支持java.util.TimeStamp。

保存到镶木地板文件时我得到的运行时错误是

线程“main”中的异常java.lang.RuntimeException:org.apache.spark.sql.parquet.ParquetTypesConverter上的scala.sys.package $ .error(package.scala:27)中不支持的数据类型TimestampType $$ anonfun $ fromDataType $ 2.适用(ParquetTypes.scala:301)

任何建议都非常明显。

由于

1 个答案:

答案 0 :(得分:1)

这实际上是1.3.0之前版本的已知错误:https://issues.apache.org/jira/browse/SPARK-4987

拉取请求已合并:https://github.com/apache/spark/pull/3820但在1.3.0发布之前它无法使用。

如果您急于求成,您可以在本地构建1.3.0的主分支,否则您可能需要等待,但有希望因为Spark 1.3.0的RC2开始是昨天被评为最终版本,所以如果候选版本的所有内容都可以,那么事情就会发展得非常快。

此致