处理apache spark中DateType的空值

时间:2016-09-09 10:03:30

标签: scala apache-spark amazon-redshift databricks

无法在apache spark中处理date列的null值。 我尝试将null替换为空字符串以及null值。

我得到的错误是 java.text.ParseException: Unparseable date: ""

我正在使用csv-spark,databricks:spark-redshift_2.11 2.0.1

代码

var originalDataFrame = sqlContext.load( "com.databricks.spark.csv", schema = sourceSchema, Map("path" -> filePath, "header" -> "false", "codec"->"org.apache.hadoop.io.compress.GzipCodec", "delimiter"->"|", "dateFormat" -> dateFormat, "nullValue"->"" ))

提前致谢。

0 个答案:

没有答案