Hive计数(*)比实际SQL表中显示的行多一行

时间:2012-06-06 07:59:22

标签: mysql hadoop hive sqoop

我使用sqoop import命令使用sqoop import从sql导入了一个表。 在从Hive执行选择计数(*)时,我将行计数为

231743

但实际的SQL表有231742行。

为什么我为这张桌子增加了一行?

我导入了2个其他类似的表,有大量的数据,我得到了确切的计数。但是这个特殊的表格给了我额外的一行。这是为什么? :-o

PS:我使用sqoop import命令包含了--hive-drop-import-delims

提前致谢:)

更新:好像我在表格中有重复的条目。它是在导入过程中生成的。任何人都知道为什么? :)

1 个答案:

答案 0 :(得分:0)

好的..我已经解决了。

在sqoop import命令中,我使用了--query SELECT * FROM table-name WHERE $CONDITIONS而不是使用--table table-name。修好了。

感谢您的评论。