如何使用Hive在两个表之间找到匹配项?

时间:2015-08-13 14:06:36

标签: hive nested-loops

我正在尝试使用Hive找到两个URL表之间的匹配:

blacklist.url      siem.url

a.com              d.fr
b.net              f.es
c.ru               a.com
...                ...

使用时:

SELECT blacklist.url FROM blacklist 
INNER JOIN siem ON (blacklist.url = siem.url);

我得不到匹配(唯一一个匹配的情况是当我把" a.com"放在两个表的同一行上时,例如当siem表看起来像{a.com ,...,...}在我的例子中。)

所以我想我可以使用这种形式的嵌套循环:

for each line1 in blacklist do
    for each line2 in siem do
        if line1 = line 2
            then print line1

我无法在Apache LanguageManual中找到任何关于嵌套循环的文档,也很少在条件语句中找到这些文档,所以如果有人知道它会有很大的帮助。

0 个答案:

没有答案