sqoop:将数据拉到带有额外列的配置单元表中

时间:2018-10-25 15:31:14

标签: hive hiveql sqoop

我需要从具有n列的MySQL表中提取记录,并将它们存储在带有额外列的配置单元中。 sqoop中有什么方法可以执行?

示例:

MySQL表具有以下字段id, name, place。而且,

配置单元表的结构为id, name, place and contact number(null)

因此,在执行sqoop时,我想在蜂巢中添加一个额外的列contact number作为(null)。

1 个答案:

答案 0 :(得分:0)

您可以在Set<Integer> quizIds = quizList.stream() .map(Quiz::getId) .collect(Collectors.toSet()); return hibernateQuizJpaRepository.findAllByCategorySetContaining(new HibernateQuizCategory(quizCategoryId)) .stream() .filter(current -> quizIds.contains(current.getId())) // ... 中使用--query选项来指定它,并使用sqoop 选择额外的列。

NULL AS