PySpark:编写ORC和添加saveAsTable之间的区别?

时间:2018-07-26 17:20:54

标签: apache-spark pyspark orc

使用以下两个命令写入ORC文件有何区别?

df.write.option('compression', 'zlib').\
  option('path', 'output.orc').\
  mode('append').\
  format('orc')

df.write.option('compression', 'zlib').\
  option('path', 'output.orc').\
  mode('append').\
  format('orc').\
  saveAsTable('output.orc')

我问,因为似乎使用“ saveAsTable”可以启用更多功能。例如,当我不能使用saveAsTable时,可以使用ORC进行存储。我担心通过添加saveAsTable会带来影响-兼容性或性能。

0 个答案:

没有答案