与带有bash的正则表达式匹配,输出顺序错误

时间:2019-01-14 17:53:43

标签: regex bash

我有一个需要处理的文本文件,它将返回所需的输出。

hostname ABC1234567
NAME: "Chassis", DESCR: "Nexus5020 Chassis"
PID: N5K-C5020P-BF     , VID: V04 , SN: SSI13390FZT

NAME: "Module 1", DESCR: "40x10GE/Supervisor"
PID: N5K-C5020P-BF     , VID: V04 , SN: JAF1344BHNK

NAME: "Module 2", DESCR: "6x10GE Ethernet Module"
PID: N5K-M1600         , VID: V01 , SN: JAB1228018M

NAME: "Module 3", DESCR: "8x1/2/4G FC Module"
PID: N5K-M1008         , VID: V01 , SN: JAB1231020C

我尝试使用正则表达式将值传递给$ host变量,但基于输出失败。

#!/bin/bash

re_descr='DESCR: "([^"]+)"'
re_sn='SN: ([^[:space:]]+)'
re_host='hostname ([^"]+)'

while read -r; do
        if [[ $REPLY =~ $re_descr ]]; then
                descr=${BASH_REMATCH[1]}
                continue
        fi
        if [[ $REPLY =~ $re_sn ]]; then
                sn=${BASH_REMATCH[1]}
        fi
        if [[ $REPLY =~ $re_host ]]; then
                host=${BASH_REMATCH[1]}
        fi
        if [[ $descr && $sn ]]; then
                printf '%s\t%s\n' "$host"-"$descr","$sn"
                unset -v host descr sn
        fi
done < <(cat file.txt)

现在它将打印

-Nexus5020 Chassis,SSI13390FZT
-40x10GE/Supervisor,JAF1344BHNK
-6x10GE Ethernet Module,JAB1228018M
-8x1/2/4G FC Module,JAB1231020C

我如何使其工作,使其以这种格式打印

ABC1234567-Nexus5020 Chassis,SSI13390FZT
ABC1234567-40x10GE/Supervisor,JAF1344BHNK
ABC1234567-6x10GE Ethernet Module,JAB1228018M
ABC1234567-8x1/2/4G FC Module,JAB1231020C

1 个答案:

答案 0 :(得分:4)

这只是逻辑错误,不是bash本身的问题。与下面的工作代码进行比较,您可以在https://ideone.com/mLj5ia的操作中看到这些工作代码:

#!/usr/bin/env bash

re_descr='DESCR: "([^"]+)"'
re_sn='SN: ([^[:space:]]+)'
re_host='hostname ([^"]+)'

while IFS= read -r line; do line=${line%$'\r'}
    [[ $line =~ $re_descr ]] && descr=${BASH_REMATCH[1]}
    [[ $line =~ $re_sn ]]    && sn=${BASH_REMATCH[1]}
    [[ $line =~ $re_host ]]  && host=${BASH_REMATCH[1]}
    if [[ $descr && $sn ]]; then
        printf '%s-%s,%s\n' "$host" "$descr" "$sn"
        descr= sn=
    fi
done
  • 我们不希望在continue被匹配之后descr,因为sn可以在同一行。
  • 您不想unset host(或清除输出行之间的host变量),因为您想重复使用相同的主机名定义。
  • 您要使用破折号和逗号而不是制表符来输出,因此请勿在{{1​​}}行中使用\t;并确保printf信号的数量与非格式字符串参数的数量匹配。
  • %s显式删除输入中的所有尾随回车符。