我可以在猪的同时(或关闭)使用多种植物和CSVExcelStorage吗?

时间:2017-06-27 15:14:37

标签: apache-pig

我正在寻找一种将关系存储为CSV格式的分割文件夹的方法。 我正从一只贝壳中发射猪。

我看了堆栈,但我没有发现任何关于这个案子的事情。

我正在使用piggybank 0.14和最后一个多数据库的java来使用多字段选择。

如果我使用CSVExcelStorage存储关系,我可以在shell中剪切输出文件,但我认为这个操作会让我丢失CSV格式。

如果我使用multiStorage存储关系,我无法用CSV格式化输出文件。

那么,是否可以将CSVExcelStorage从关系应用于关系?

你还有其他建议吗?

谢谢,

1 个答案:

答案 0 :(得分:0)

很好,我使用shell来模拟带有一些过滤器和CSVExcelStorage的多数据库。

sklt="file.pig.skeleton"
pig="file.pig"
cp ${sklt} ${pig}

for waza in $anOtherVar
do
    echo "R2 = R1 FILTER JEANNO IN ('${waza}')" >> ${pig}
    echo -e "STORE R2 INTO '$myPath/${waza}' USING org.apache.pig.piggybank.storage.CSVExcelStorage(';');\n" >> ${pig}
done
pig -f ${pig} -p table=$anOtherVar -p myPath=/past/a/box/

如果这个令人敬畏的解决方案可以帮助其他猪瘾...