我是hive的新手,我有两个表,其中包含这样创建的访问日志。
CREATE EXTERNAL TABLE rwloglines(line string) STORED AS TEXTFILE LOCATION 'hdfs:///rwlogs'
CREATE EXTERNAL TABLE dpxloglines(line string) STORED AS TEXTFILE LOCATION 'hdfs:///dpxlogs'
这两个将包含由20个字符组成的Id [A-Z] [0-9]。我想加入这两个表并搜索Id。我应该在hive中写什么查询
有人可以帮助我。
答案 0 :(得分:0)
最简单的方法是将每个文件的内容溢出到各种列中,如id,ip adde,error msg等。然后将其加载到hive表中,在其模式中指定这些列。
然后
select id from rwloglines a join dpxloglines b where id='';