情况1:使用自由格式查询导入sqoop: --query“从emp中选择*,id> 500”
情况2:使用where条件导入sqoop: --table emp-其中“ id> 500”
哪个更快?为什么?
答案 0 :(得分:0)
Query-2将比query-1快。 Query-1无法使用数据库目录来获取表的元数据。获取的元数据用于动态创建一个类,该类在MapReduce中使用,该类在内部为查询运行。
但是,Query-2使用数据库目录来获取表的元数据 这是Query-2比Query-1更快的原因之一