awk 3.1.7版中的字符类范围

时间:2016-11-22 07:29:34

标签: regex awk posix character-class

grep不同,我无法在`awk中定义数字字符类的大小/范围。任何线索正确的方向是值得赞赏的。

cat input
1abc
12abc
123abc
1234abc
12345abc

grep中,我可以定义数字字符类的大小/长度

grep -P '^\d{3,4}' input #or grep -P '^[[:digit:]]{3,4}' input
123abc
1234abc
12345abc
grep -P '^\d{4,}' input  #or grep -P '^[[:digit:]]{4,}' input 
1234abc
12345abc

现在我想用awk做这个,但同样的正则表达式不起作用。

例如以下命令不提供任何输出。

awk '/^[[:digit:]]{3,4}/' input 
awk '/^([[:digit:]]){3,4}/' input

我期待上面的命令打印

123abc
1234abc
12345abc

注1 :目前我用来定义范围但是对于大范围来说它并不甜。

awk '/^[0-9][0-9]?[0-9]?/' input

注2:

awk --version |head -1
GNU Awk 3.1.7

1 个答案:

答案 0 :(得分:3)

使用--posix选项。

在awk版本3的手册页中,您可以阅读:

r{n,m}     One or two numbers inside braces denote an interval expression.  If there is one number in the braces, the preceding regu-
           lar  expression  r  is  repeated  n times.  If there are two numbers separated by a comma, r is repeated n to m times.  If
           there is one number followed by a comma, then r is repeated at least n times.
           Interval expressions are only available if either --posix or --re-interval is specified on the command line.