Question

如何在Linux（csh）中提取特定单词后面的单词？更准确地说，我有一个文件，其中包含一行，如下所示：

[some useless data] --pe_cnt 100 --rd_cnt 1000 [some more data]

我想提取100字后面的数字 --pe_cnt 。我不能使用sed，只有当你想要提取整行时才能使用。也许我可以使用awk？

此外，我有多个文件具有不同的值而不是100所以我需要一些提取值但不依赖于值的文件。

Answer 1

使用awk：

awk '{for(i=1;i<=NF;i++) if ($i=="--pe_cnt") print $(i+1)}' inputFile

基本上循环遍历该行的每个单词。当您找到第一个要找的时候，抓住下一个单词并打印出来。

使用grep：

grep -oP "(?<=--pe_cnt )[^ ]+" inputFile

Answer 2

你可以使用sed。只需制作一组想要匹配的组，并将整行替换为组：

sed -n 's/^.*pe_cnt\s\+\([0-9]\+\).*$/\1/p' file

Answer 3

如果--pe_cnt和100之间存在单空格字符，您可以使用前瞻和后瞻断言

grep -oP '(?<=--pe_cnt\s)\d+(?=\s+--rd_cnt)'

Answer 4

这可能是最短的版本：

grep -oP 'pe_cnt \K[^ ]+' file