mrjob加入非唯一键

时间:2016-12-13 15:44:11

标签: python join mapreduce mrjob

使用mrjob,我想将table_1的关键字a映射到table_2和table_3的xy的值,即zw如输出中所示。我写了一些代码mrjob combiner not working python,它输出为

a1 x1-x2-y1
a2 y1 

但是如何内连接table_1 table_2 table_3以获得给定的所需输出。我引用https://gist.github.com/ewencp/7010531作为内连接,但在这种情况下这可能没有帮助。

Table_1:
a1 x1
a1 x2
a1 y1
a2 y1

Table_2:
y1 z1
y2 z2

Table_3:
x1 w1
x2 w2

desired output:
a1 w1-w2-z1
a2 z1

0 个答案:

没有答案