使用csv文件进行Hive搜索

时间:2017-05-11 15:34:31

标签: csv search hive

我对Hive比较新,所以我甚至不确定要使用的正确术语,所以这可能已经解决了。道歉,如果它有。

这是我的情景;我们有数千个设备的大型数据表,按序列号键入。我需要查找设备的特定变量,通常一次几百个。我知道我可以对数百个条目进行包含“SN = 001或SN = 002或SN = 003 ..”的搜索,但这很麻烦且耗时。我希望能够做的是有一个包含序列号列表的csv文件,并执行一个搜索,上面写着“给我这个csv文件中所有设备所需的变量”。这是可能的,如果是这样,我该怎么做?谢谢!

1 个答案:

答案 0 :(得分:2)

in_file

演示

<强>的bash

cat>/tmp/myfile.txt
111
123
222
333
789

<强>蜂房

create table mytable (mycol string);
insert into mytable values (123),(456),(789);
select  *
from    mytable
where   in_file  (mycol,'/tmp/myfile.txt')
;
+-------+
| mycol |
+-------+
|  123  |
|  789  |
+-------+