我在长文件上运行很长的sed脚本。我一直想要一个进度指示器,我刚刚学会了pv。它的ETA功能并不准确,但这不是我的问题。这就是我正在做的事情:
$ cat Crisis.pdf.txt.detagged.tmp | pv -ltea -s 4087 | ./pret2.sed > test.inprocess.tmp
0:17:55 [3.49/s] ETA 0:01:37
我的问题是关于第二个数字。它表示每秒3.49 [行,因为-l]。但它首先是406,然后下降到100左右,然后是50左右,然后缓慢但稳定地逐渐变细,直到它看到你所看到的位置为止。
我应该担心这个,还是预期的行为?用尾巴观察我的输出文件,速度似乎相当一致。
答案 0 :(得分:0)
以下是您提供的示例行
/[a-z]/s/\bDatos\b/·Data·/g
我注意到你给的每一行都有这个
/[a-z]/
这不是必需的。你的每个正则表达式都包含a-z
,如果是的话
发现一个会找到另一个。