有这样的事吗?任何人都可以对此进行澄清吗?我一直在使用AWK执行简单的任务,如打印列和合并大数据文件,但不是用于计算?我在想是否可以使用我的计算机或网络中的所有节点和CPU运行AWK并行。但是怎么样?使用并行AWK的主要目的是什么?
感谢您的投入。
发布问题后,我发现Parallel AWK确实存在。你可以找到更多相关信息。这是链接http://www.parallel-awk.org/
答案 0 :(得分:2)
并行awk实现的问题在于语义明确假设操作按顺序处理。例如:
awk '{print NR, $0}'
为您提供类似于cat -n
的输出。并行处理的难点在于NR是处理的总行数,而不仅仅是给定文件中的行数(FNR
)
此外,还有更复杂的技巧涉及getline之类的命令,这些命令无法并行化(例如,脚本可以短路以模拟gnu nextfile
扩展名)