应用错误收集

PIGLatin如何将2个CSV与行数和列数过多进行比较

时间：2015-03-10 00:47:54

标签： hadoop apache-pig

在比较2个CSV文件方面，我有一个PIG场景。基本上，它应该做的是读取2个CSV文件，将它们相互比较，并创建一个包含ROW编号的日志文件，如果可能的话，创建不同值的列号。

示例输出：

找到1个不同的值：

行：＃8764

专栏：＃67

预期：8984954

实际：0

PIG有办法做到这一点吗？

0 个答案:

没有答案