是否可以更改sqoop2中的列和记录分隔符?

时间:2013-10-21 08:49:58

标签: apache sqoop

是否可以将默认列分隔符(逗号)更改为Sqoop2中的其他字符?我在一些邮件档案中读到它尚不支持。

如果不是,我们如何指定封闭和转义字符,以便Sqoop正确提取包含逗号和引号的值的列?这是默认工作还是需要通过设置任何选项来打开它?

1 个答案:

答案 0 :(得分:2)

就像我怀疑的那样,Sqoop2尚不支持更改分隔符。请参阅以下内容:

http://grokbase.com/t/cloudera/cdh-user/137q954ffz/sqoop2-import-field-delimiter

  • 默认情况下,列分隔符为逗号
  • 字符串字段应该用单引号括起来(这样可以处理带逗号的字段)
  • 如果该字段本身包含单引号,则使用反斜杠\
  • 对其进行转义