标签: hadoop ssis hdfs bigdata
我想实现能够下载位于远程Hadoop集群上的大型CSV文件的SSIS作业。当然,在Hadoop系统上只有一个普通的FTP服务器不会暴露HDFS文件,因为它使用本地文件系统。
我想知道是否有一个位于HDFS之上的FTP服务器实现。我更喜欢这种方法,而不是将文件从HDFS复制到本地FS,然后让FTP服务器为此服务,因为我需要分配更多的存储空间。
答案 0 :(得分:1)
我从一个按预期工作的开源项目分叉:https://github.com/jamesattard/maroodi