我的本地计算机没有安装hdfs。我想从远程hdfs集群中检索文件。实现这一目标的最佳方法是什么?我是否需要{hdf}中的get
个文件到其中一个群集机器fs然后使用ssh来检索它们?我希望能够通过说bash脚本以编程方式执行此操作。
答案 0 :(得分:6)
以下是步骤:
hadoop fs -get
命令直接获取文件还有替代品
如果您的主机无法安装Hadoop二进制文件作为客户端,则可以使用以下说明。
ssh <user>@<host> "hadoop fs -get <hdfs_path> <os_path>"