分区发现不适用于spark avro阅读器

时间:2018-02-14 16:12:50

标签: scala apache-spark-sql spark-dataframe

我试图阅读按年,月和日分区的AVRO文件。例如:

完整文件路径

/test/data/source1/year=2018/month=2/day=14/file.avro

基本路径

/test/data/source1/

示例代码

val df = sqlContext
                .read()
                .format("com.databricks.spark.avro")
                .option("basePath", "/test/data/source1/")
                .option("avroSchema", avroSchema.toString())
                .load("/test/data/source1/year=2018/")

在输出DF中,year列未显示。可能是什么问题?

根据Spark文档Partition Discovery,它应该可以正常工作。

更新

我使用的是Spark 1.6,因为AVRO无法正常工作,但对于Parquet来说,它的工作正在......

0 个答案:

没有答案