如果正在运行的Spark JOB,另一个进程会删除.hiveStaging目录会怎样?
或者,是否有任何HDFS锁会导致目录不被删除
由于
答案 0 :(得分:0)
Hive在运行Hive客户端的计算机和默认HDFS实例上都使用临时文件夹。这些文件夹用于存储每个查询的临时/中间数据集,并且通常在查询完成时由hive客户端清理。
一旦查询执行完成,数据就会移动到输出HDFS位置。
当您删除.hiveStaging
目录时,您的配置单元查询/驱动程序代码将失败并显示java.io.IOException
。