标签: presto
有一个配置项(max-split-size)来设置一个split的最大大小。换句话说,我可以更改项目的值以更改拆分的数量。
max-split-size
split
我知道,更多分割会同时使用更多cpu,搜索速度会更快。
cpu
如果是这样,为什么presto设置项目的默认值为32M而不是1M?
32M
1M
答案 0 :(得分:2)
创建的每个拆分都有开销,因此您不希望它们太小。此外,某些文件格式(如ORC)的分割小于ORC条带的大小(通常为几十到几百兆