是否有使用分布式缓存分发文件的指南?
我有一个大小为86746785的文件(我使用hadoop dfs -dus
- 不知道这是在bytes
还是什么内容。分发此文件是一个好主意吗?
答案 0 :(得分:3)
唯一可行的答案是“它取决于”。
使用分布式缓存时需要考虑的是将文件复制到任务中涉及的每个节点,这显然需要带宽。此外,通常如果您希望文件位于分布式缓存中,您将把文件保留在内存中,因此您必须考虑到这一点。
至于你的情况 - 是的,那些是字节。大小约为86 MB,这对于分布式缓存来说非常好。几百MB内的任何东西都应该是。
答案 1 :(得分:1)
除TC1的答案外,还要考虑:
答案 2 :(得分:0)
默认情况下,分布式缓存的大小为10GB。但最好在分布式缓存中保留几MB的数据。否则会影响应用程序的性能。