Question

我正在从Spark Scala的HDFS文件夹中读取JSON文件

代码：

val path = "hdfs://year/month/date/*"
var df = spark.read.format("json").load(path)

因此它将读取日期文件夹中的所有部分JSON文件。

但是我想读取year文件夹中的所有JSON文件，并将其附加到DF。有任何建议。

Answer 1

val path = "hdfs://year/*/*/*"
var df = spark.read.format("json").load(path)

这行得通。