hadoop hive:计算蜂巢中的重叠

时间:2013-08-22 09:29:04

标签: hive

我有蜂巢的问题,我有一个有100个产品的列表产品。使用表结构:

CREATE TABLE `product` (productid STRING, product_name STRING)
ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t' LINES TERMINATED BY '\n'
STORED AS TEXTFILE;

用户的活动列表信息,但结构为:

的产品
CREATE TABLE `information` (login_date STRING, productid STRING, account_name STRING)
PARTITIONED BY(dt STRING, app STRING)
ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t' LINES TERMINATED BY '\n'
STORED AS TEXTFILE;

现在我想要计算每个产品与列表产品的重叠。但在蜂巢中,我没有办法做到这一点。请给我任何支持。我真的很需要它们。谢谢大家。

0 个答案:

没有答案