我一直在寻找将数据移到HDFS系统的方法,想知道Apache Sqoop是否可用于从外部REST服务中提取/提取数据?
答案 0 :(得分:1)
我最喜欢从REST服务中提取数据的方法:
curl http:// | hdfs -putt / / my / hdfs / directory
答案 1 :(得分:0)
来自http://sqoop.apache.org/docs/1.4.5/SqoopUserGuide.html
Sqoop是一种用于在Hadoop和关系数据库之间传输数据的工具。您可以使用Sqoop将数据从关系数据库管理系统(RDBMS)(如MySQL或Oracle)导入Hadoop分布式文件系统(HDFS),转换Hadoop MapReduce中的数据,然后将数据导出回RDBMS。
因此它不支持从REST服务导入数据。