使用控制字符作为分隔符的Sqoop导入

时间:2019-05-17 15:03:33

标签: hadoop hive sqoop

我想使用控制字符(\ u0001)从SQLServer提取一个表,因为我的表几乎包含所有可用的定界符,并且我无法使用其余定界符,因为它将来可能会到达数据中。所以我想使用控制字符来摄取它。

以下是我的sqoop命令的结构

sqoop import --driver net.sourceforge.jtds.jdbc.Driver --connect "my_connection_string" --username abc -P --query 'select * from xyz' --fields-terminated-by $'\u0001' --target-dir Path_In_HDFS --as-textfile -m 1

当我运行代码时,我得到下面的错误提示,

Cannot understand character argument: \u0001

我也想在配置单元中创建一个表,以使用相同的定界符加载此数据。 请指出正确的方法。

感谢帮助!

1 个答案:

答案 0 :(得分:1)

-以“ \ 001”结尾的字段可以解决您的问题