使用Sqoop将数据加载到HDFS中

时间:2014-09-30 21:19:08

标签: hdfs sqoop webhdfs sqoop2

我一直在寻找将数据移到HDFS系统的方法,想知道Apache Sqoop是否可用于从外部REST服务中提取/提取数据?

2 个答案:

答案 0 :(得分:1)

我最喜欢从REST服务中提取数据的方法:

curl http:// | hdfs -putt / / my / hdfs / directory

答案 1 :(得分:0)

来自http://sqoop.apache.org/docs/1.4.5/SqoopUserGuide.html

  

Sqoop是一种用于在Hadoop和关系数据库之间传输数据的工具。您可以使用Sqoop将数据从关系数据库管理系统(RDBMS)(如MySQL或Oracle)导入Hadoop分布式文件系统(HDFS),转换Hadoop MapReduce中的数据,然后将数据导出回RDBMS。

因此它不支持从REST服务导入数据。