由于数据中的特殊字符,Sqoop从HDFS导出到ORACLE失败

时间:2018-12-18 14:19:15

标签: oracle hadoop export hdfs sqoop

在尝试使用以下命令将数据从hdfs导出到oracle时:

  

sqoop导出--connect --username --table    --export-dir --m 4   --verbose -输入字段以“ |”结尾--input-lines终止于'\ n'--input-escaped-by'/' -P---schema

获取无法解析输入数据的异常,因为它具有网站URL,并且在某些数据字段中具有_和日期。

以下是我要导出的hdfs文件中的记录示例:

  

compID |网站| date_fetched

sam_140|https://www.sam.com/profile_link_sam|20181212
lok_231|https://www.lok.com|20181212

解析例外日志:

例外1:

  

无法解析输入数据:表中的“ https:/www.sam.comprofile_link_sam”   name .__ loadFromFields(表名.java:1449)位于   tablename.parse(tablename.java:1272)位于

例外2:

  

org.apache.sqoop.mapreduce.TextExportMapper.map(TextExportMapper.java:89)   ... 10更多原因:java.lang.IllegalArgumentException:时间戳记   格式必须为yyyy-mm-dd hh:mm:ss [.fffffffff]   java.sql.Timestamp.valueOf(Timestamp.java:204)位于

使用sqoop导出作业,如何将以上示例数据导出到Oracle? 如果我缺少其他任何参数来成功解析它,请提供帮助。

谢谢!

0 个答案:

没有答案