我试图阅读按年,月和日分区的AVRO文件。例如:
完整文件路径
/test/data/source1/year=2018/month=2/day=14/file.avro
基本路径
/test/data/source1/
示例代码
val df = sqlContext
.read()
.format("com.databricks.spark.avro")
.option("basePath", "/test/data/source1/")
.option("avroSchema", avroSchema.toString())
.load("/test/data/source1/year=2018/")
在输出DF中,year
列未显示。可能是什么问题?
根据Spark文档Partition Discovery,它应该可以正常工作。
更新
我使用的是Spark 1.6,因为AVRO无法正常工作,但对于Parquet来说,它的工作正在......