如何在Linux(csh)中提取特定单词后面的单词? 更准确地说,我有一个文件,其中包含一行,如下所示:
[some useless data] --pe_cnt 100 --rd_cnt 1000 [some more data]
我想提取100
字后面的数字 --pe_cnt
。
我不能使用sed,只有当你想要提取整行时才能使用。也许我可以使用awk?
此外,我有多个文件具有不同的值而不是100
所以我需要一些提取值但不依赖于值的文件。
答案 0 :(得分:28)
使用awk
:
awk '{for(i=1;i<=NF;i++) if ($i=="--pe_cnt") print $(i+1)}' inputFile
基本上循环遍历该行的每个单词。当您找到第一个要找的时候,抓住下一个单词并打印出来。
使用grep
:
grep -oP "(?<=--pe_cnt )[^ ]+" inputFile
答案 1 :(得分:6)
你可以使用sed。只需制作一组想要匹配的组,并将整行替换为组:
sed -n 's/^.*pe_cnt\s\+\([0-9]\+\).*$/\1/p' file
答案 2 :(得分:1)
如果--pe_cnt
和100
之间存在单空格字符,您可以使用前瞻和后瞻断言
grep -oP '(?<=--pe_cnt\s)\d+(?=\s+--rd_cnt)'
答案 3 :(得分:0)
这可能是最短的版本:
grep -oP 'pe_cnt \K[^ ]+' file