我在Hive中有以下两个查询,以获得某些特定结果。
select * from table1 where col1 IN (a, b, c)
select * from table1 where col1=a OR col1=b OR col1=c
根据我的理解, IN 将在内部转换为 OR 的顺序。 在spark-sql中本地执行,但未发现任何性能差异(例如执行时间,过滤数据扫描等)。 因此,我们可以根据功能在IN和OR中看到什么区别。 任何帮助将不胜感激。
答案 0 :(得分:0)
Col1 in (a,b,c) is a macro that expands to Col1=a or Col1=b or Col1=c.
没有性能差异