在mrjob
python中,我知道如何基于公共密钥加入两个大数据库。
Table_1:
a1 x1
a2 x2
Table_2:
a1 w1
a2 w2
output:
a1 x1-w1
a2 x2-w2
但是如果我们必须内连接Table_1的值和Table_2的键,即
Table_1:
a1 x1
a2 x2
Table_2:
x1 w1
x2 w2
output:
a1 x1-w1
a2 x2-w2
这可能在使用mrjob的python map rduce中吗?谢谢