最大化文件存储效率

时间:2016-04-08 11:28:11

标签: file filesystems

我有一组需要存储的大文件,我的理解是给定文件应占用的块数是以字节为单位的文件大小除以块大小(以字节为单位),如果是,则总是向上舍入不是一整块。

所以,对于我的例子,我有一个41,481,854,065字节的文件,以及一个块大小为4096字节的文件系统。

我在10,127,406个块处将其作为理论最小块数。但是, du 报告该文件正在使用11,399,100个块,这给了我5,208,858,624字节差异的巨大差异,对于44GB的文件是4.85GB。

这对我来说似乎很多,我想尝试理解为什么有那么多松弛的空间,当我无理地期望最多有4k时。

我有三个问题:

  1. 可能导致这种巨大差异的原因是什么?
  2. 如何检测实际导致它的原因?
  3. 我能做些什么来提高效率和减少空间吗?
  4. 我很确定我在某处做了一些不合理的假设,但想知道它在哪里。

1 个答案:

答案 0 :(得分:0)

所以,既然没有人即将到来,我自己的研究和猜测只出现了以下几种选择:

  1. 文件在同一磁盘上严重碎片化。
  2. 文件分布在存储阵列上的多个物理磁盘上。
  3. 文件已故意分布在多个物理磁盘上,以便最大限度地提高读取访问速度。