我是sqoop的新手。
我正在运行以下sqoop命令从oracle表导入数据
sqoop import --connect jdbc:oracle:thin:<username>/<password>@<IP>:1521:MSDP2 --query "select * from table_name where \$CONDITIONS AND created=TRUNC(TO_DATE('20171101','YYYYMMDD'))" --target-dir /stage/ESM/esm_tmp --hive-table ESM_tab --hive-import -m 1
这是使用COMMA分隔符创建一个配置单元表。由于一列包含客户的地址作为其值,因此该字段中包含逗号。这导致表格中的数据不稳定。
谷歌搜索时我发现我们可以使用&#34; - 字段 - 终止 - &#34; sqoop命令中的选项指定我们想要的分隔符。但我不知道在sqoop命令中将它放在哪里。有人可以帮助我将命令放在上面的sqoop命令中的正确位置。我更喜欢| (管道)分隔符。答案 0 :(得分:2)
您可以在--fields-terminated-by '|'
之后的命令中的任何位置添加sqoop import
。
答案 1 :(得分:-1)
导入sqoop后,您可以在任何地方使用。查询后可以使用的最佳情况
-以“ |”结尾的字段
它将起作用。请尝试