一个名为" output.json"的输出文件夹存在于HDFS上,它包含以下文件
|- _SUCCESS
\- part-r-00000-3c9a6268-ff29-4a76-8d74-8c867e7f0f0f.json
有时它包含更多"部分 - *"文件。
从这个文件夹中读取的正确方法是什么?我猜它应该像
read("path/to/output.json") // and rest should be taken care off
注意:HDFS驻留在远程服务器上