使用并行AWK - 有没有人听说过这个?

时间:2010-12-08 05:41:24

标签: awk

有这样的事吗?任何人都可以对此进行澄清吗?我一直在使用AWK执行简单的任务,如打印列和合并大数据文件,但不是用于计算?我在想是否可以使用我的计算机或网络中的所有节点和CPU运行AWK并行。但是怎么样?使用并行AWK的主要目的是什么?

感谢您的投入。

发布问题后,我发现Parallel AWK确实存在。你可以找到更多相关信息。这是链接http://www.parallel-awk.org/

1 个答案:

答案 0 :(得分:2)

并行awk实现的问题在于语义明确假设操作按顺序处理。例如:

awk '{print NR, $0}'

为您提供类似于cat -n的输出。并行处理的难点在于NR是处理的总行数,而不仅仅是给定文件中的行数(FNR

此外,还有更复杂的技巧涉及getline之类的命令,这些命令无法并行化(例如,脚本可以短路以模拟gnu nextfile扩展名)