应用错误收集

场景：我想在远程计算机的本地Hadoop集群处理 1.5T 数据上运行map reduce程序。但我的本地Hadoop集群只有 100G 硬盘空间。

输入数据：来自远程机器的1.5T数据本地机器磁盘大小：100G。

问题：如何直接从远程机器读取1.5T数据？

我知道有两种方法可以做到这一点。

在mapreduce程序中有没有其他方法可以从远程机器读取文件？