bash正则表达式匹配字符串

时间:2013-07-02 08:35:05

标签: regex string bash

我正在尝试编写一个包含函数的bash脚本,所以当给出.tar.tar.bz2.tar.gz等文件时,它会使用tar和相关的开关来解压缩文件

我正在使用if ifif语句测试文件名以查看它的结尾,并且我无法使用正则表达式元字符进行匹配。

为了不断重写脚本,我在命令行使用'test',我认为下面的语句应该有效,我已经尝试了括号,引号和元字符的各种组合,但仍然失败。

test sed-4.2.2.tar.bz2 = tar\.bz2$; echo $?
(this returns 1, false)

我确定问题很简单,我到处都看,但我无法理解如何做到这一点。有人知道我该怎么做吗?

6 个答案:

答案 0 :(得分:218)

要匹配正则表达式,您需要使用=~运算符。

试试这个:

[[ sed-4.2.2.tar.bz2 =~ tar.bz2$ ]] && echo matched

或者,您可以对==运算符使用通配符(而不是正则表达式):

[[ sed-4.2.2.tar.bz2 == *tar.bz2 ]] && echo matched

如果不考虑可移植性,我建议使用[[代替[test,因为它更安全,更强大。有关详细信息,请参阅What is the difference between test, [ and [[ ?

答案 1 :(得分:46)

执行此操作的功能

extract () {
  if [ -f $1 ] ; then
      case $1 in
          *.tar.bz2)   tar xvjf $1    ;;
          *.tar.gz)    tar xvzf $1    ;;
          *.bz2)       bunzip2 $1     ;;
          *.rar)       rar x $1       ;;
          *.gz)        gunzip $1      ;;
          *.tar)       tar xvf $1     ;;
          *.tbz2)      tar xvjf $1    ;;
          *.tgz)       tar xvzf $1    ;;
          *.zip)       unzip $1       ;;
          *.Z)         uncompress $1  ;;
          *.7z)        7z x $1        ;;
          *)           echo "don't know '$1'..." ;;
      esac
  else
      echo "'$1' is not a valid file!"
  fi
}

其他注释

在上述评论中回应Aquarius Power,We need to store the regex on a var

在匹配表达式后设置变量BASH_REMATCH,$ {BASH_REMATCH [n]}将匹配括号中包含的第n个组,即以下${BASH_REMATCH[1]} = "compressed"${BASH_REMATCH[2]} = ".gz"

if [[ "compressed.gz" =~ ^(.*)(\.[a-z]{1,5})$ ]]; 
then 
  echo ${BASH_REMATCH[2]} ; 
else 
  echo "Not proper format"; 
fi

(上面的正则表达式并不意味着它是文件命名和扩展的有效代码,但它适用于该示例)

答案 2 :(得分:7)

我没有足够的代表在这里发表评论,所以我提交了一个新答案来改进dogbane的答案。点。在正则表达式

[[ sed-4.2.2.tar.bz2 =~ tar.bz2$ ]] && echo matched

实际上会匹配任何字符,而不仅仅是'tar.bz2'之间的文字点,例如

[[ sed-4.2.2.tar4bz2 =~ tar.bz2$ ]] && echo matched
[[ sed-4.2.2.tar§bz2 =~ tar.bz2$ ]] && echo matched

或任何不需要使用'\'转义的内容。 那么严格的语法应该是

[[ sed-4.2.2.tar.bz2 =~ tar\.bz2$ ]] && echo matched

或者你可以更严格,并在正则表达式中包含前一个点:

[[ sed-4.2.2.tar.bz2 =~ \.tar\.bz2$ ]] && echo matched

答案 3 :(得分:4)

由于您正在使用bash,因此不需要创建子进程来执行此操作。这是一个完全在bash中执行的解决方案:

[[ $TEST =~ ^(.*):\ +(.*)$ ]] && TEST=${BASH_REMATCH[1]}:${BASH_REMATCH[2]}

说明:序列“冒号和一个或多个空格”前后的组由模式匹配运算符存储在BASH_REMATCH数组中。

答案 4 :(得分:0)

shopt -s nocasematch

if [[ sed-4.2.2.$LINE =~ (yes|y)$ ]]
 then exit 0 
fi

答案 5 :(得分:-1)

if [[ $STR == *pattern* ]]
then
    echo "It is the string!"
else
    echo "It's not him!"
fi

为我工作! GNU bash, version 4.3.11(1)-release (x86_64-pc-linux-gnu)