从diff输出中删除不需要的上下文行(使用sed)

时间:2014-02-06 17:15:54

标签: regex bash sed text-manipulation

我从diff输入了几个文件。这些文件包含4行长的信息块,用空行分隔,有时1-3行可以不同。

我使用参数diff调用-c3因为我需要不同行的上下文来获取完整的信息块,因为行本身毫无价值。

因此,我的输出变得非常混乱,难以阅读。因此,我正在寻找一种方法来切除不属于不同块的上下文行。

输入文件的示例:

Port-configuration of Switch "HP_e5412zl_secondary"
Timestamp: 20140206-161001

Interface:      A1
Description:    Uplink to primary switch
VLAN Untagged:  2
VLANs Tagged:   1 23 42 103 169

Interface:      A2
Description:    -- Not set --
VLAN Untagged:  30
VLANs Tagged:   

Interface:      A3
Description:    WS-198
VLAN Untagged:  1
VLANs Tagged:   

Interface:      A4
Description:    -- Not set --
VLAN Untagged:  30
VLANs Tagged:   

Interface:      A5
Description:    Printer finances
VLAN Untagged:  30
VLANs Tagged: 

要重新制作我的方案,请使用此方法,只需更改一些随机行

当我在两个不同的文件上运行diff -c3时,我会得到类似的结果:

*** 2014-02-06/HP_e5412zl_secondary.txt   2014-02-06 16:14:38.024112434 +0100
--- 2014-02-05/HP_e5412zl_secondary.txt   2014-02-05 16:14:27.415741855 +0100
***************
*** 246,255 ****
  VLAN Untagged:        1
  VLANs Tagged:

  Interface:      A4
  Description:    -- Not set --
  VLAN Untagged:  30
  VLANs Tagged:   

  Interface:      A5
  Description:    Printer finances
--- 245,254 ----
  VLAN Untagged:        1
  VLANs Tagged:

  Interface:      A4
  Description:    WS-211
  VLAN Untagged:  1
  VLANs Tagged:   

  Interface:      A5
  Description:    Printer finances
***************
...

我已经尝试了我最好的sed-tricks,但未能将我需要的信息与上下文杂乱隔离开来。所需的输出如下所示:

*** 2014-02-06/HP_e5412zl_secondary.txt   2014-02-06 16:14:38.024112434 +0100
--- 2014-02-05/HP_e5412zl_secondary.txt   2014-02-05 16:14:27.415741855 +0100
***************
*** 246,255 ****

  Interface:      A4
  Description:    -- Not set --
  VLAN Untagged:  30
  VLANs Tagged:   

--- 245,254 ----

  Interface:      A4
  Description:    WS-211
  VLAN Untagged:  1
  VLANs Tagged:   

***************
...

- >虽然我甚至不需要包含行号的行。一个简单的分隔符就足够了。

我试过了:

diff -c3 file1 file2 | sed -n '/^[ ]*Inter.*/,/^[ ]*VLANs.*/p'

而且:

diff -c3 file1 file2 | sed -e '/^[*-]{3,}.*/,/^$/d'

此外,我通过屏蔽*或仅使用其中一个字符来试验-\*个字符。使用它们使用和不使用封闭括号进行屏蔽和取消屏蔽 - 没有任何效果。

帮助?请?

Bonusquestion: 我想用colordiff而不是diff来做这件事。这会增加难度(因为嵌入的颜色代码或任何东西)?

1 个答案:

答案 0 :(得分:2)

如果awk可以接受,你可以使用:

awk '/^[^! ]/ {p = 1; print;}  /^ *$/ {if (p++ % 2 == 0) print;}  (p % 2 == 0) { print; }'

说明:

  • 在任何差异元输出上,设置p=1并打印行
  • 在任何空行上,将{1}添加到p。如果p是偶数,则打印该行。
  • 否则,如果p是偶数,则打印该行。

这会产生您提供的所需输出。请注意,这不适合反馈到diff(因为行号需要更改),并且仍然包含所有diff元素,因为你说你想要它。

请注意,我的diff将!作为更改行的第一个字符,因此我也将其视为非元输出。

这可能适用于着色差异,如果你能找到一种方法来欺骗它认为你的管道可以显示颜色转义。

相关问题