MapReduce:如何连接2个表:R(a,b)x S(c,d)其中b <c

时间:2016-01-16 04:28:54

标签: database algorithm hadoop mapreduce

=“”

每个表中给定记录,你有

Table_name(R/S) | attribute_1(a/c) | attribute_2(b/d)
.
.
.

例如,这可以是输入文件的内容:

R|$a_1$|$b_1$
R|$a_2$|$b_2$
S|$c_1$|$d_1$
R|$a_3$|$b_3$
S|$c_2$|$d_2$

输出是以下行:

$a_i$|$b_i$|$c_j$|$d_j$

,其中$ b_i&lt; C_J $

(这是书中的练习&#34;大规模数据集挖掘&#34;。它位于此链接的第22页:http://infolab.stanford.edu/~ullman/mmds/ch2.pdf(练习2.3.5)。该书免费提供)

我花了半天时间浏览互联网,仍然不知道如何解决这个问题......

0 个答案:

没有答案