示例
prod2-03_dl-httpd-prod-8080_access_referer_log.20181111-050000
我需要值8080
。因此,基本上我们需要在第二次出现'-'
之后才需要数字值。
我们尝试了以下选项:
echo "prod2-03_dl-httpd-prod-8080_access_referer_log.20181111-050000" | sed -r 's/([^-][:digit:]+[^-][:digit:]).*/\1/'
答案 0 :(得分:1)
无需诉诸sed
,BASH支持正则表达式:
$ A=prod2-03_dl-httpd-prod-8080_access_referer_log.20181111-050000
$ [[ $A =~ ([^-]*-){2}[^[:digit:]]+([[:digit:]]+) ]] && echo "${BASH_REMATCH[2]}"
8080
答案 1 :(得分:0)
尝试此Perl解决方案
$ data="prod2-03_dl-httpd-prod-8080_access_referer_log.20181111-050000"
$ perl -ne ' /.+?\-(\d+).+?\-(\d+).*/g and print $2 ' <<< "$data"
8080
或
$ echo "$data" | perl -ne ' /.+?\-(\d+).+?\-(\d+).*/g and print $2 '
8080
答案 2 :(得分:0)
您可以使用IFS在POSIX外壳中执行此操作以识别零件,并循环执行以找到所需的模式:
s="prod2-03_dl-httpd-prod-8080_access_referer_log.20181111-050000"
# Set a field separator
IFS=-
# Expand your variable into positional parameters
set - $s
# Drop the first two fields
shift 2
# Drop additional fields until one that starts with a digit
while ! expr "$1" : '[0-9]' >/dev/null; do shift; done
# Capture the part of the string that is not digits
y="$1"; while expr "$y" : '[0-9]' >/dev/null; do y="${y##[[:digit:]]}"; done
# Strip off the non-digit part from the original field
x="${1%$y}"
请注意,对于看起来像aa-bb-123cc45-foo
的字符串,此操作可能会失败。如果“有趣”字段中可能还有其他数字字符串,则需要更多代码。
如果您有bash
外壳,则可以通过一系列bash参数扩展来做到这一点...
# Strip off the first two "fields"
x="${s#*-}"; x="${x#*-}"
shopt -s extglob
x="${x##+([^[:digit:]])}"
# Identify the part on the right that needs to be stripped
y="${x##+([[:digit:]])}"
# And strip it...
x="${x%$y}"
这与POSIX不兼容,因为如果需要extglob
。
当然,bash为您提供了许多选择。考虑一下此功能:
whatdigits() {
local IFS=- x i
local -a a
a=( $1 )
for ((i=3; i<${#a[@]}; i++)) {
[[ ${a[$i]} =~ ^([0-9]+) ]] && echo "${BASH_REMATCH[1]}" && return 0
}
return 1
}
然后您可以运行以下命令:
$ whatdigits "12-ab-cd-45ef-gh"
45
$ whatdigits "$s"
8080