此问题与任何代码问题无关。只需要你的建议。
我们有一个 ~100GB 的文件,我们正在应用 sed 来替换一些参数。 这个过程需要很长时间,并且会占用CPU
用 awk / tr / perl或任何其他unix实用程序替换 sed 可以在这种情况下提供帮助。
注意:
time 命令以外的任何建议。
答案 0 :(得分:3)
你可以做一些事情来加快速度:
LANG=C sed '...'
这两个可能会有很大帮助。其他任何东西都会带来微小的改进,甚至是不同的工具。
关于LANG=C
- 通常匹配是在您的环境设置的任何编码中完成的,这可能是UTF-8
,这会导致对UTF-8字符进行额外查找。如果你的模式只使用ascii,那么一定要使用LANG = C.
您可以尝试的其他事项:
答案 1 :(得分:0)
尝试不同的AWK:mawk对我来说特别快。