我们在数据块中有57个视图,目前我们必须在笔记本中单独运行这些视图,并在进行进一步分析之前将其下载为export(*)。csv。 我希望能够遍历每个视图,导出到csv并允许一次下载所有视图。 当前的SQL输出pyspark数据帧,但是它们似乎仅在数据块本身中有用。 我们在任何地方都没有可用的MODIFY设置,因此无法将其保存到DBFS。
我创建了一个使用
的小python脚本
sqlContext.sql(strSQL)
命令,生成一个pyspark数据帧,但目前我无法对其进行任何操作。
如果可能,应该相对简单(?)。我不确定我的代码会帮忙
理想情况下,我希望在代码运行完毕后,以zip(或其他压缩格式)的形式提供所有csv可供下载。