我需要将文件从我的集群外的FTP服务器复制到Hadoop,即 HDFS。
提前致谢。
答案 0 :(得分:3)
答案 1 :(得分:2)
试试这个:
hadoop fs -get ftp://uid:password@server_url/file_path temp_file | hadoop fs -moveFromLocal tmp_file hadoop_path / dest_file
答案 2 :(得分:1)
你看过WebHDFS(http://hadoop.apache.org/docs/r1.0.4/webhdfs.html)还是HttpFS(http://hadoop.apache.org/docs/r2.2.0/hadoop-hdfs-httpfs/index.html)
服务需要访问Hadoop集群,然后您可以将HttpFS端口公开给可以访问FTP服务器的服务器。