我使用sqoop import命令使用sqoop import从sql导入了一个表。 在从Hive执行选择计数(*)时,我将行计数为
231743
但实际的SQL表有231742行。
为什么我为这张桌子增加了一行?
我导入了2个其他类似的表,有大量的数据,我得到了确切的计数。但是这个特殊的表格给了我额外的一行。这是为什么? :-o
PS:我使用sqoop import命令包含了--hive-drop-import-delims
提前致谢:)
更新:好像我在表格中有重复的条目。它是在导入过程中生成的。任何人都知道为什么? :)
答案 0 :(得分:0)
好的..我已经解决了。
在sqoop import命令中,我使用了--query SELECT * FROM table-name WHERE $CONDITIONS
而不是使用--table table-name。修好了。
感谢您的评论。