美好的一天,
我使用sqoop(1.4.6-cdh5.7.4)将数据从hdfs加载到我的oracle数据库中。我的文件有明确定义的分隔符,但偶尔会有一个特殊字符出现在一列或多列中,并且会导致sqoop作业失败并且无法解析'错误。
在尝试插入rdbms表之前,是否可以修改sqoop作业创建的java程序以包括剥离或甚至将特殊字符括在引号中?
例如字段^是分隔符---> ^ soit 0h16mn,vorous jusqu' au ^
谢谢, Fid获取
答案 0 :(得分:0)
错误主要是由于数据中的特殊字符。你能改变你的SQL脚本并过滤掉特殊字符吗?