BASH:如何提取特定文本包围的子字符串

时间:2013-10-09 08:55:12

标签: bash extract

我正在尝试从遵循特定模式的文件名中提取数字:

file-8923489_something.txt
another_file-8923489_something.txt
some-other_file-8923489_something.txt

我想提取文本“file-”和“_something”之间的数字,它将与上述3个文件名一起使用。

最好的方法是什么?

是否可以仅使用运算符来执行此操作,例如##和%%?怎么样:

filename=file-8923489_something.txt
file=${${filename##*file}%%_something}}

然而,它并没有像我预期的那样发挥作用。

3 个答案:

答案 0 :(得分:2)

使用pre BASH正则表达式:

x="some-other_file-8923489_something.txt"
[[ "$x" =~ file-([0-9]*)_something ]] && echo ${BASH_REMATCH[1]}
8923489

或此grep -P也可以:

grep -oP "file-\K\d+(?=_something)" file
8923489
8923489
8923489

或使用awk:

awk -F 'file-|_something' '{print $2}' file
8923489
8923489
8923489

答案 1 :(得分:0)

使用grep

$ echo "file-8923489_something.txt
another_file-8923489_something.txt
some-other_file-8923489_something.txt" | grep -Po '(?<=file-)\d+'
8923489
8923489
8923489

或使用纯bash

d="your_string"
d1=${d%_*}
your_final_string=${d1##*-}

测试

$ d="file-8923489_something.txt"
$ d1=${d%_*}
$ echo $d1
file-8923489
$ echo ${d1##*-}
8923489

$ d="some-other_file-8923489_something.txt"
$ d1=${d%_*}
$ echo $d1
some-other_file-8923489
$ echo ${d1##*-}
8923489

$ d="another_file-8923489_something.txt"
$ d1=${d%_*}
$ echo $d1
another_file-8923489
$ echo ${d1##*-}
8923489

答案 2 :(得分:0)

  

是否可以仅使用运算符,...

$ filename="file-8923489_something.txt"
$ file=${foo//[^0-9]/}
$ echo $file
8923489

您可能需要参考Shell Parameter Expansion

或者,您可以说:

$ file=$(tr -dc '[[:digit:]]' <<< "$filename")
$ echo $file
8923489