为什么shuttles和df报告的磁盘大小有几%的差异?

时间:2019-07-01 14:46:45

标签: python python-3.x filesystems disk diskspace

我正在编写一个简单的监视脚本,我想在其中添加磁盘空间检查。但是我发现报告的可用空间在系统dfshutils.disk_usage()之间是不同的。

在已安装三个磁盘的系统上:

# df / /mnt/2TB1 /mnt/1TB1
Filesystem      1K-blocks       Used Available Use% Mounted on
/dev/sda1       472437724  231418380 216997128  52% /
/dev/sdb1      1921802520 1712163440 111947020  94% /mnt/2TB1
/dev/sdc1       960380648  347087300 564438888  39% /mnt/1TB1

# python3
Python 3.6.8 (default, Jan 14 2019, 11:02:34)
[GCC 8.0.1 20180414 (experimental) [trunk revision 259383]] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> import shutil
>>> (t, u, f) = shutil.disk_usage('/')
>>> (t, u, f)
(483776229376, 236973805568, 222203674624)
>>> u/t
0.48984177224594366
>>> (t, u, f) = shutil.disk_usage('/mnt/2TB1')
>>> (t, u, f)
(1967925780480, 1753255362560, 114633748480)
>>> u/t
0.8909153891628782
>>> (t, u, f) = shutil.disk_usage('/mnt/1TB1')
>>> (t, u, f)
(983429783552, 355400192000, 578002624512)
>>> u/t
0.361388477290517

差异分别为3%,5%和3%。它来自哪里,哪个结果是正确的?

3 个答案:

答案 0 :(得分:3)

Python 似乎具有正确的结果。
默认情况下,[man7]: DF(1)man df)以 1 KiB 块显示数字(大小)。但是,考虑到将运算符(除以1024)应用于除法器和除数(在计算百分比时)的事实,它本身会减小,因此它与最终结果无关。

示例(针对特定的 dir ):

  1. 运行 df (默认情况下,输出为 KiB
  2. 运行df -B 1(以字节为单位输出)
  3. 运行以下 Python 脚本:

    import sys, shutil
    
    path = sys.argv[1] if len(sys.argv) > 1 else "/"
    t, u, f = shutil.disk_usage(path)
    percent = 100 * u / t
    print("(Python) - Volume name\t{:} {:} {:} {:.3f}% ({:.0f}) {:}".format(t, u, f, percent, percent, path))
    
[cfati@cfati-ubtu16x64-0:~]> for f in "/" "/media/sf_shared_00"; do echo df "${f}" && df ${f} && echo df -B 1 "${f}" && df -B 1 ${f} && echo Python script on "${f}" && python3 -c "import sys, shutil; path = sys.argv[1] if len(sys.argv) > 1 else \"/\"; t, u, f = shutil.disk_usage(path); percent = 100 * u / t; print(\"(Python) - Volume name\t{:} {:} {:} {:.3f}% ({:.0f}) {:}\".format(t, u, f, percent, percent, path))" ${f} && echo && echo; done
df /
Filesystem                                   1K-blocks     Used Available Use% Mounted on
/dev/mapper/ubtu16x640_lvg0-ubtu16x640_root0 102067544 10999896  85859792  12% /
df -B 1 /
Filesystem                                      1B-blocks        Used   Available Use% Mounted on
/dev/mapper/ubtu16x640_lvg0-ubtu16x640_root0 104517165056 11263893504 87920427008  12% /
Python script on /
(Python) - Volume name  104517165056 11263893504 87920427008 10.777% (11) /


df /media/sf_shared_00
Filesystem     1K-blocks      Used Available Use% Mounted on
shared_00      327679996 155279796 172400200  48% /media/sf_shared_00
df -B 1 /media/sf_shared_00
Filesystem        1B-blocks         Used    Available Use% Mounted on
shared_00      335544315904 159006511104 176537804800  48% /media/sf_shared_00
Python script on /media/sf_shared_00
(Python) - Volume name  335544315904 159006511104 176537804800 47.388% (47) /media/sf_shared_00

如图所示,步骤 #2。 中的数字(大小)与步骤 #3中的数字(大小)相同。 。计算百分比(在3种情况中的任何一种情况下), Python 百分比似乎是正确的。

目前尚不清楚为什么 df 报告这些百分比(没有在源代码中查看),但是可能是(所有这些都是纯粹的猜测):

  • 它倾向于保护用户的利益(报告的百分比高于实际水平)
  • 它与逻辑磁盘单元(扇区)有关。
    例如,在 4 KiB 4096 )扇区磁盘上,一个4097字节的文件将被占用(通常为4097字节),但考虑到该磁盘逻辑单位是扇区(而不是字节-某种程度上类似于#pragma pack),文件将占用2个扇区( 8 KiB ),因此其基础大小将大于报告的人

答案 1 :(得分:2)

正如ChristiFati所指出的,两种工具的比率used / total相同,但是Use%报告的df字段与100 · used / total不同。

例如,让我们检查安装在/dev/sda1上的/的值。

df.total = 472437724
df.used = 231418380
df.available = 216997128
df.percentage = 52

shutil.total = 483776229376
shutil.used = 236973805568
shutil.free = 222203674624

已用df /总计df = 0.4898 =免费关闭/关闭总计
但是...
df.used / df.total = 0.4898 0.52 = df.percentage / 100

coreutils的df实现的source code为这个问题提供了一些启示。 three lines 1171-1173是相关的。 pct是百分比。

  

uintmax_t u100 = v->used * 100; uintmax_t nonroot_total = v->used + v->available; pct = u100 / nonroot_total + (u100 % nonroot_total != 0);

我们可以看到df不是计算used / total而是计算used / (used + free)。请注意,used + free < total

我怀疑……

total包括为元数据保留的空间,例如文件位于文件系统中的位置(取决于文件系统,该文件可能包括胖表,索引节点等)。由于您不能将该空间用于常规文件,因此可以使用Use%来代替(used + free)中不包含元数据的空间。

但是,一项测试表明……

这不是完整的故事。以下脚本在2 MiB文件中生成FAT12和ext2文件系统。该脚本必须使用sudo执行。

#! /bin/bash

check() {
  head -c 2MiB /dev/zero > fs
  mkfs."$@" fs
  mkdir fsmount
  mount -o loop fs fsmount
  df fsmount
  umount fsmount
  rm -r fs fsmount
}

echo fat12:
check fat -F 12

echo ext2:
check ext2

我得到了输出

fat12:
[...]
Filesystem     1K-blocks  Used Available Use% Mounted on
/dev/loop0          2028     0      2028   0% /tmp/fsmount
ext2:
[...]                           
Creating filesystem with 2048 1k blocks and 256 inodes
[...]
Filesystem     1K-blocks  Used Available Use% Mounted on
/dev/loop0          2011    21      1888   2% /tmp/fsmount

请注意,在两种情况下,两个文件的总大小均小于2048 KiB = 2 MiB的文件系统。两个文件系统都没有文件,但是对于ext2 df报告使用了21 KiB(可能与this question有关)。

答案 2 :(得分:0)

1Gb曾经是1024 MB,但是制造商发现了一种营销技巧,即以50 Gb的名称调用50000 MB,就搞砸了这些程序。

所以区别在于这些软件实现如何处理那些1000或1024的Megas。