正则表达式 - 在字符类中使用短手字符

时间:2012-03-31 02:41:21

标签: regex grep

我需要做一些涉及正则表达式的操作。

我正在操作的字符串:

/dev/fd0        /media/floppy0  auto    rw,us

基本上,我想要做的是采用前两个参数(/dev/fd0/media/floppy0),我想在此之后忽略所有内容。为了实现我已经尝试了下面显示的正则表达式。我的问题是,为什么以下正则表达式产生不同的结果?

正则表达式1:

grep -o '/dev/f\S*\s*\S*' /etc/fstab

输出(我期待的输出):

/dev/fd0        /media/floppy0

正则表达式2:

grep -o '/dev/f[\S]*\s*[\S]*' /etc/fstab

输出:

/dev/f

正则表达式3:

grep -o '/dev/f[^\s]*\s[^\s]*' /etc/fstab

输出:

/dev/fd0        /media/floppy0  auto    rw,u

我不明白为什么2和3不会产生与1相同的输出。我看到它的方式是2,无论我是否把非空白空格字符放在{{{ 1}})在一个字符类中。同样适用于3.此外,为什么2与3不同? \S[\S]不相同吗?

1 个答案:

答案 0 :(得分:2)

我想我不能说它们是否“应该”不同 - 有许多正则表达式引擎,你的解释是正确的 - 但在POSIX Basic正则表达式(BREs; grep使用的正则表达式类型默认情况下,[\S]是包含\S的字符类,[^\s]是包含除\和{{1}之外的所有字符的字符类}。 (这是根据规范,要求在BRE和ERE中,“特殊字符s'.''*''['(句号,星号) ,left-bracket和反斜杠,分别)将在括号表达式中失去其特殊含义。“[link])'\'的内部字符类等价物为\s:< / p>

[:space:]

某些版本的grep -o '/dev/f[^[:space:]]*\s*[^[:space:]]*' /etc/fstab 支持非标准grep选项,以使用与Perl兼容的正则表达式(PCRE)而不是POSIX正则表达式。与Perl兼容的正则表达式确实具有您描述的行为,因此如果您的-P支持该选项,那么您可以像这样使用它:

grep