我正在处理一个庞大的数据集,该数据集在 Hive 中具有1万多行和600多个列。
有多个行列,其所有行的值均为NULL
。
如何获取仅包含NULL
值的所有列的列表?
答案 0 :(得分:3)
使用count(col)
对某一列的所有NOT NULL
行进行计数。
包含所有NULL
的列将具有0
个计数:
select
count(col1) as col1_cnt,
count(col2) as col2_cnt,
...
count(colN) as colN_cnt
from table