应用错误收集

时间：2014-03-18 13:46:35

标签： bash unix

此问题与任何代码问题无关。只需要你的建议。

我们有一个 ~100GB 的文件，我们正在应用 sed 来替换一些参数。这个过程需要很长时间，并且会占用CPU

用 awk / tr / perl或任何其他unix实用程序替换 sed 可以在这种情况下提供帮助。

注意：

time 命令以外的任何建议。

答案 0 :(得分：3)

你可以做一些事情来加快速度：

这两个可能会有很大帮助。其他任何东西都会带来微小的改进，甚至是不同的工具。

关于LANG=C - 通常匹配是在您的环境设置的任何编码中完成的，这可能是UTF-8，这会导致对UTF-8字符进行额外查找。如果你的模式只使用ascii，那么一定要使用LANG = C.

您可以尝试的其他事项：

答案 1 :(得分：0)

尝试不同的AWK：mawk对我来说特别快。