应用错误收集

我试图阅读按年，月和日分区的AVRO文件。例如：

完整文件路径

/test/data/source1/year=2018/month=2/day=14/file.avro

基本路径

/test/data/source1/

示例代码

val df = sqlContext
                .read()
                .format("com.databricks.spark.avro")
                .option("basePath", "/test/data/source1/")
                .option("avroSchema", avroSchema.toString())
                .load("/test/data/source1/year=2018/")

在输出DF中，year列未显示。可能是什么问题？

根据Spark文档Partition Discovery，它应该可以正常工作。

更新

我使用的是Spark 1.6，因为AVRO无法正常工作，但对于Parquet来说，它的工作正在......

分区发现不适用于spark avro阅读器

0 个答案: