如何使用列名从数据框访问数据

时间:2017-02-22 18:49:36

标签: hadoop sqoop

我有一个oracle表,其中存储了xml数据(xmlType)。我尝试使用以下命令将其sqoop到hdfs。 xml字段在hdfs文件中显示为null。

sqoop import --connect jdbc:oracle:thin:@DBconnString 
             --username uname --password pwd 
             --delete-target-dir 
             --table sample 
             --map-column-java column1=String

任何人都可以建议我做错了吗?

1 个答案:

答案 0 :(得分:0)

这是sqoop限制,不支持xmlType。

https://sqoop.apache.org/docs/1.4.6/SqoopUserGuide.html#_supported_data_types

这里有一个解决方法https://issues.apache.org/jira/browse/SQOOP-2749基本上将你的xmlType转换为clob,然后使用以下选项将其映射到字符串

--map-column-java "XMLRECORD=String"