我们的文件平均大小为10 TB。想知道是否有比这更好的方法呢?
style
答案 0 :(得分:3)
我认为没有人能按要求真正回答您的问题。这是我真正需要给您一个很好答案的一些遗漏细节。
没有这6个项目,任何人都只是猜测。
使用OP响应进行更新:
这就是我将给出的信息。
在执行所有操作之前,您需要查看是否已使网络连接饱和。鉴于您正在通过网络处理大量数据,因此除了升级交换机和调整服务器上的网络堆栈之外,您无能为力。当且仅当您确认您的网络连接未固定在100%以下时,我才会尝试其他方法。
从简单开始,增加BufferedReader上的缓冲区大小,我认为Java默认将缓冲区大小设置为8192。根据您设置HDFS文件系统和网络的方式,您可能仅通过增加缓冲区大小就可以大大提高速度。
祝你好运!