假设我使用pig将数据存储在hdfs中名为abc的文件中 script test.pig。
我通过将参数传递给pig脚本来并行运行相同代码的20个实例。
pig -param "RANGE= a > 100 AND a < 4000" -f test.pig
pig -param "RANGE= a > 4001 AND a < 10000" -f test.pig
是否可以将数据存储在同一文件abc中。 由于我并行运行所有20个实例,因此我收到错误,该文件已存在于hdfs中。 我可以覆盖它吗?