我对Hive比较新,所以我甚至不确定要使用的正确术语,所以这可能已经解决了。道歉,如果它有。
这是我的情景;我们有数千个设备的大型数据表,按序列号键入。我需要查找设备的特定变量,通常一次几百个。我知道我可以对数百个条目进行包含“SN = 001或SN = 002或SN = 003 ..”的搜索,但这很麻烦且耗时。我希望能够做的是有一个包含序列号列表的csv文件,并执行一个搜索,上面写着“给我这个csv文件中所有设备所需的变量”。这是可能的,如果是这样,我该怎么做?谢谢!
答案 0 :(得分:2)
in_file
演示
<强>的bash 强>
cat>/tmp/myfile.txt
111
123
222
333
789
<强>蜂房强>
create table mytable (mycol string);
insert into mytable values (123),(456),(789);
select *
from mytable
where in_file (mycol,'/tmp/myfile.txt')
;
+-------+
| mycol |
+-------+
| 123 |
| 789 |
+-------+