标签: hadoop apache-pig
在比较2个CSV文件方面,我有一个PIG场景。基本上,它应该做的是读取2个CSV文件,将它们相互比较,并创建一个包含ROW编号的日志文件,如果可能的话,创建不同值的列号。
示例输出:
找到1个不同的值:
行:#8764
专栏:#67
预期:8984954
实际:0
PIG有办法做到这一点吗?