在文本文件“bash”中的特定字符之间获取字符串块

时间:2018-06-14 12:52:13

标签: bash awk sed grep

有人可以帮我找到一个代码,用于复制字符串'X 0'(X = H,He ...)和最近的'****'之间的所有字符串?我使用bash进行编程。

H 0
 S   3 1.00       0.000000000000
      0.1873113696D+02  0.3349460434D 01
      0.2825394365D+01  0.2347269535D+00
      0.6401216923D+00  0.8137573261D+00
 S   1 1.00       0.000000000000
      0.1612777588D+00  0.1000000000D+01
****
He 0
 S   3 1.00       0.000000000000
      0.3842163400D+02  0.4013973935D 01
      0.5778030000D+01  0.2612460970D+00
      0.1241774000D+01  0.7931846246D+00
 S   1 1.00       0.000000000000
      0.2979640000D+00  0.1000000000D+01
****

我想对所有“X 0”(X = H,He ...)执行此操作,特别是为所有“X 0”获取这样的隔离文本:

 H 0
 S   3 1.00       0.000000000000
      0.1873113696D+02  0.3349460434D 01
      0.2825394365D+01  0.2347269535D+00
      0.6401216923D+00  0.8137573261D+00
 S   1 1.00       0.000000000000
      0.1612777588D+00  0.1000000000D+01
****

 He 0
 S   3 1.00       0.000000000000
      0.3842163400D+02  0.4013973935D 01
      0.5778030000D+01  0.2612460970D+00
      0.1241774000D+01  0.7931846246D+00
 S   1 1.00       0.000000000000
      0.2979640000D+00  0.1000000000D+01
 ****

所以我想我必须找到一种方法来使用包含“X 0”的字符串。 我试图使用grep -A2000 'H 0' filename.txt | grep -B2000 -m8 '****' filename.txt >> filenameH.txt,但它对X的其他例子不太有用,只是为了第一个。

2 个答案:

答案 0 :(得分:1)

使用awk

awk '/^[^ ]+ 0$/{p=1;++c}/^\*\*\*\*$/{print >>FILENAME c;p=0}p{print >> FILENAME c}' file

该脚本会创建与模式/^[^ ]+ 0$//^\*\*\*\*$/匹配的块一样多的文件。文件索引从1开始。

答案 1 :(得分:0)

如果记录以4星分隔。需要gawk

$ awk -v RS='\\*\\*\\*\\*\n' '$1~/^He?$/{printf "%s", $0 RT > FILENAME $1}' file

这只会提取HHe条记录。如果您不想限制,只需删除大括号前的条件。 (相当于$1=="H" || $1=="He"