我正在尝试将数据从RDBMS(Mysql)导入HDFS。我做了一些关于Sqoop教程的阅读,发现了一些有用的链接。 http://devslogics.blogspot.com/2013/09/sqoop-java-client.html?showComment=1399588094791#c7484088811270691337 我可以使用上面粘贴的链接中的代码将数据导入TEXT_FILE中的HDFS。 默认情况下,Sqoop使用逗号作为默认分隔符。这对我不起作用。 我现在想要实现的是自定义分隔符/转义字符。
我也可以通过执行以下命令来执行此操作 sqoop import --connect jdbc:mysql://xxx.xx.xx:3306 / sqoop --username xxx --password xxx --table students --enclosed-by \“--escaped-by \”
非常感谢任何有关如何通过sqoop-client java api实现此功能的帮助。
提前致谢 肖恩
答案 0 :(得分:0)
从链接的博客文章中可以看出,您使用的是Sqoop2。
不幸的是,Sqoop2不允许你设置分隔符。
当你运行命令行“sqoop”时,你正在运行Sqoop1,此时它支持更多选项。
您可以通过以下顶部答案在您的Java代码中使用Sqoop1: How to use Sqoop in Java Program?