使用awk或sed将文件的特定区域输出到另一个文件?

时间:2015-09-29 12:55:46

标签: regex bash awk sed

我有一个看起来像这样的文件:

d "Text 1":6,64;1 /filesys1/db1.d2
d "Text 2":6,64;1 /filesys1/db1.d2 f 730
d "Text 3":6,64;1 /filesys1/db1.d2 
d "TextA":6,64;1 /filesys1/db1.d2 f 46000
d "TextB":6,64;1 /filesys1/db1.d2
d "TextC":6,64;1 /filesys1/db1.d2 f 120000
...

我需要从引号之间获取所有内容,然后获取该行的最后2个字符并将其放入新文件中。我可以单独完成这两件作品,但我无法将它们结合起来并让它发挥作用。

awk -F'"' '$0=$2' datatmp4 > dataout2

会得到我:

Text 1
Text 2
Text 3
TextA
TextB
TextC

awk '{ print substr( $NF, length($NF) -1, length($NF) ) }' datatmp4 > dataout

会得到我:

d2
30
d2
00
d2
00

我需要的是:

Text 1 d2
Text 2 30
Text 3 d2
TextA 00
TextB d2
TextC 00

4 个答案:

答案 0 :(得分:3)

您可以使用$ 2连接引号之间的文本以及最后2个字符的结果,如下所示:

awk -F '"' '{print $2, substr($NF, length($NF)-1, length($NF))}' datatmp4 > dataout

答案 1 :(得分:3)

你在自己身上做得太难了。当你想要的只是整行的最后两个字符时,没有理由关心或尝试操作线上的最后一个字段($ NF):

$ awk -F'"' '{print $2, substr($0,length()-1)}' file
Text 1 d2
Text 2 30
Text 3 2
TextA 00
TextB d2
TextC 00

输出的第三行以2<blank>结尾,因为它是输入文件中的内容。这并不匹配你发布的所需输出但是要清楚 - 你是否想要显示每行的最后一个字符,你说你想要,或者你想要最后2个非空白字符作为您发布的所需输出暗示了什么?

答案 2 :(得分:0)

$ awk -F"\"" '{match($NF,/..$/,a); print $2,a[0]}' last2
Text 1 d2
Text 2 30
Text 3 2
TextA 00
TextB d2
TextC 00

答案 3 :(得分:-1)

使用sed(BRE):

sed 's/^[^"]*"\([^"]*\).*\(.[^ ]\)/\1 \2/;' file

sed(ERE)的另一种方式:

sed -E 's/^[^"]*"|"[^ ]*( ).*(.[^ ])/\1\2/g' file

使用awk:

awk -F'"' '{ print $2 " " gensub(/.*(.[^ ])/, "\\1", 1)}' file

字段分隔符是引用。 gensub替换除了最后两个字符之外的所有字符(第二个字符不能是空格)。