加入两个配置单元表并搜索字符串

时间:2014-08-03 17:50:16

标签: hive

我是hive的新手,我有两个表,其中包含这样创建的访问日志。

CREATE EXTERNAL TABLE rwloglines(line string) STORED AS TEXTFILE LOCATION 'hdfs:///rwlogs'
CREATE EXTERNAL TABLE dpxloglines(line string) STORED AS TEXTFILE LOCATION 'hdfs:///dpxlogs'

这两个将包含由20个字符组成的Id [A-Z] [0-9]。我想加入这两个表并搜索Id。我应该在hive中写什么查询

有人可以帮助我。

1 个答案:

答案 0 :(得分:0)

最简单的方法是将每个文件的内容溢出到各种列中,如id,ip adde,error msg等。然后将其加载到hive表中,在其模式中指定这些列。

然后

  select id from rwloglines a join dpxloglines b where id='';