mapreduce连接2个不同数据库mrjob的键和值

时间:2016-12-14 05:25:02

标签: python hadoop mapreduce mrjob

mrjob python中,我知道如何基于公共密钥加入两个大数据库。

Table_1:
a1 x1
a2 x2

Table_2:
a1 w1
a2 w2

output:
a1 x1-w1
a2 x2-w2

但是如果我们必须内连接Table_1的值和Table_2的键,即

Table_1:
a1 x1
a2 x2

Table_2:
x1 w1
x2 w2

output:
a1 x1-w1
a2 x2-w2

这可能在使用mrjob的python map rduce中吗?谢谢

0 个答案:

没有答案