PIGLatin如何将2个CSV与行数和列数过多进行比较

时间:2015-03-10 00:47:54

标签: hadoop apache-pig

在比较2个CSV文件方面,我有一个PIG场景。基本上,它应该做的是读取2个CSV文件,将它们相互比较,并创建一个包含ROW编号的日志文件,如果可能的话,创建不同值的列号。

示例输出:

找到1个不同的值:

行:#8764

专栏:#67

预期:8984954

实际:0

PIG有办法做到这一点吗?

0 个答案:

没有答案