我正在运行sqoop 1.4.6版,尝试将DB2表作为逗号分隔的文本文件导入HDFS。如果值小于DB2列大小,则生成的文本文件在逗号之前用空格填充所有变量。有谁知道为什么会这样,以及如何解决它?似乎这大大提升了我文件的大小。
这是我正在运行的导入:
sqoop import -Dmapred.job.queue.name=q1 --connect jdbc:db2://mydb2.com:50000/mydb --username xxxx --password xxxx
--table mytables.table1 --target-dir /users/me/table1 --fields-terminated-by ',' --split-by id --direct