每个表中给定记录,你有
Table_name(R/S) | attribute_1(a/c) | attribute_2(b/d)
.
.
.
例如,这可以是输入文件的内容:
R|$a_1$|$b_1$
R|$a_2$|$b_2$
S|$c_1$|$d_1$
R|$a_3$|$b_3$
S|$c_2$|$d_2$
输出是以下行:
$a_i$|$b_i$|$c_j$|$d_j$
,其中$ b_i< C_J $
(这是书中的练习"大规模数据集挖掘"。它位于此链接的第22页:http://infolab.stanford.edu/~ullman/mmds/ch2.pdf(练习2.3.5)。该书免费提供)
我花了半天时间浏览互联网,仍然不知道如何解决这个问题......