标签: apache-spark pyspark apache-spark-sql databricks azure-databricks
我有一个巨大的数据框,需要从中生成一个Azure Blob中的单个CSV。我正在使用Azure Databricks,因此不能使用HDFS merge命令。
对于大文件,使用合并或分区不是一个好的选择。 在Azure Databricks中执行此操作的正确方法是什么?