将xargs的输出重定向到文件

时间:2014-09-28 10:28:57

标签: bash find xargs

我想删除目录中每个文件的第一行,并通过在每个文件名的末尾添加“.tmp”来保存相应的输出。例如,如果存在名为input.txt的文件,其中包含以下内容:

line 1
line 2

我想在名称为input.txt.tmp的同一目录中创建一个文件,其中包含以下内容

line 2

我正在尝试这个命令:

find . -type f | xargs -I '{}' tail -n +2 '{}' > '{}'.tmp

问题是,它不是将输出写入带有.tmp后缀的单独文件,而是只创建一个名为{}.tmp的文件。我知道这种情况正在发生,因为输出重定向是在xargs完全完成后完成的。但有没有办法告诉xargs输出重定向是它的参数的一部分?

2 个答案:

答案 0 :(得分:3)

请注意,您可以将find-exec一起使用,而无需管道xargs

find . -type f -exec sh -c 'f={}; tail -n+2 $f > $f.tmp' \;
                            ^^^^  ^^^^^^^^^^^^^^^^^^^^^
                              |   perform the tail and redirection
                  store the name of the file

答案 1 :(得分:2)

如果你有GNU Parallel,你可以运行:

find . -type f | parallel tail -n +2 {} '>' {}.tmp

所有新计算机都有多个内核,但大多数程序本质上是串行的,因此不会使用多个内核。但是,许多任务都非常可并行化:

  • 在许多文件上运行相同的程序
  • 为文件中的每一行运行相同的程序
  • 为文件中的每个块运行相同的程序

GNU Parallel是一个通用的并行程序,可以很容易地在同一台机器上或在你有ssh访问权限的多台机器上并行运行作业。

如果要在4个CPU上运行32个不同的作业,并行化的直接方法是在每个CPU上运行8个作业:

Simple scheduling

GNU Parallel会在完成后生成一个新进程 - 保持CPU处于活动状态,从而节省时间:

GNU Parallel scheduling

<强>安装

个人安装不需要root访问权限。这可以在10秒内完成:

(wget -O - pi.dk/3 || curl pi.dk/3/ || fetch -o - http://pi.dk/3) | bash

有关其他安装选项,请参阅http://git.savannah.gnu.org/cgit/parallel.git/tree/README

了解详情

查看更多示例:http://www.gnu.org/software/parallel/man.html

观看介绍视频:https://www.youtube.com/playlist?list=PL284C9FF2488BC6D1

完成教程:http://www.gnu.org/software/parallel/parallel_tutorial.html

注册电子邮件列表以获得支持:https://lists.gnu.org/mailman/listinfo/parallel