我对dd命令很熟悉,但我很少需要自己使用它。今天我需要,但我遇到的行为似乎很奇怪。
我想创建一个100M的文本文件,每行包含单个单词“testing”。这是我的第一次尝试:
~$ perl -e 'print "testing\n" while 1' | dd of=X bs=1M count=100
0+100 records in
0+100 records out
561152 bytes (561 kB) copied, 0.00416429 s, 135 MB/s
嗯,这很奇怪。其他组合怎么样?
~$ perl -e 'print "testing\n" while 1' | dd of=X bs=100K count=1K
0+1024 records in
0+1024 records out
4268032 bytes (4.3 MB) copied, 0.0353145 s, 121 MB/s
~$ perl -e 'print "testing\n" while 1' | dd of=X bs=10K count=10K
86+10154 records in
86+10154 records out
42524672 bytes (43 MB) copied, 0.35403 s, 120 MB/s
~$ perl -e 'print "testing\n" while 1' | dd of=X bs=1K count=100K
102400+0 records in
102400+0 records out
104857600 bytes (105 MB) copied, 0.879549 s, 119 MB/s
因此,在这四个明显等效的命令中,所有这些命令都生成不同大小的文件,其中只有一个是我期望的文件。那是为什么?
编辑:通过旁白,我有点尴尬,我没有想到“是测试”而不是那个更长的Perl命令。答案 0 :(得分:7)
我还不确定原因,但在保存之前使用此方法不会填满整个块。尝试:
perl -e 'print "testing\n" while 1' | dd of=output.txt bs=10K count=10K iflag=fullblock
10240+0 records in
10240+0 records out
104857600 bytes (105 MB) copied, 2.79572 s, 37.5 MB/s
iflag=fullblock
似乎强制dd累积输入,直到块已满,但我不确定为什么这不是默认值,或默认情况下实际执行的操作。
答案 1 :(得分:7)
要查看正在发生的事情,让我们看一下类似调用的strace
输出:
execve("/bin/dd", ["dd", "of=X", "bs=1M", "count=2"], [/* 72 vars */]) = 0
…
read(0, "testing\ntesting\ntesting\ntesting\n"..., 1048576) = 69632
write(1, "testing\ntesting\ntesting\ntesting\n"..., 69632) = 69632
read(0, "testing\ntesting\ntesting\ntesting\n"..., 1048576) = 8192
write(1, "testing\ntesting\ntesting\ntesting\n"..., 8192) = 8192
close(0) = 0
close(1) = 0
write(2, "0+2 records in\n0+2 records out\n", 31) = 31
write(2, "77824 bytes (78 kB) copied", 26) = 26
write(2, ", 0.000505796 s, 154 MB/s\n", 26) = 26
…
当dd
进行单read()
调用来阅读每个块时会发生什么情况。这在从磁带读取时是合适的,这是dd
最初主要用于的。在磁带上,read
确实读取了一个块。从文件中读取时,必须注意不要指定过大的块大小,否则read
将被截断。从管道读取时,情况更糟:您读取的块的大小取决于生成数据的命令的速度。
故事的寓意不是使用dd
来复制数据,除了安全的小块。除了使用bs=1
之外,永远不要来自管道。
(GNU dd有一个fullblock
标志,告诉它表现得体面。但其他实现却没有。)
答案 2 :(得分:2)
我最好的猜测是dd
从管道中读取,当它为空时,它假定它读取整个块。结果非常不一致:
$ perl -e 'print "testing\n" while 1' | dd of=X bs=1M count=100
0+100 records in
0+100 records out
413696 bytes (414 kB) copied, 0.0497362 s, 8.3 MB/s
user@andromeda ~
$ perl -e 'print "testing\n" while 1' | dd of=X bs=1M count=100
0+100 records in
0+100 records out
409600 bytes (410 kB) copied, 0.0484852 s, 8.4 MB/s