我正在通过使用自由格式查询和使用where条件来进行sqoop导入

时间:2019-05-07 08:41:34

标签: hadoop sqoop

情况1:使用自由格式查询导入sqoop:    --query“从emp中选择*,id> 500”

情况2:使用where条件导入sqoop:     --table emp-其中“ id> 500”

哪个更快?为什么?

1 个答案:

答案 0 :(得分:0)

Query-2将比query-1快。 Query-1无法使用数据库目录来获取表的元数据。获取的元数据用于动态创建一个类,该类在MapReduce中使用,该类在内部为查询运行。

但是,Query-2使用数据库目录来获取表的元数据 这是Query-2比Query-1更快的原因之一