匹配“\ b(一二三|一二|二三)\ b”,重复次数最少

时间:2013-09-17 14:59:31

标签: regex overlap

我只使用PCRE进行了此操作,但我希望它能够与Javascript的RegExp一起使用。那,和正则表达式是丑陋的。还有其他更实用的方法吗?

请注意,虽然主题是“OneTwoThree”,但为了简洁,我使用“qwe”。

$ cat test.txt | grep -oP '\b(q(\g<we>|\g<w>)|(?<we>(?<w>w)e))\b'
qwe
qw
we

文件test.txt包含:

qwe qw we q w e qq qe wq ww eq ew ee qqq qqw qqe qwq qww qeq qew qee wqq wqw wqe wwq www wwe weq wew wee eqq eqw eqe ewq eww ewe eeq eew eee

(只有前三个匹配。)

2 个答案:

答案 0 :(得分:4)

这样的东西适用于您的样本数据:

/\b(qwe?|we)\b/
/\b(q?we|qw)\b/

您可以测试here

但是对于你在标题中指定的完整模式,它将是

/\b(OneTwo(Three)?|TwoThree)\b/
/\b((One)?TwoThree|OneTwo)\b/

现在,这不是更具可读性,但它确实略微减少了冗余:

/\b(?!w\b)q?we?\b/

您可以测试here

或者您的完整模式:

/\b(?!Two\b)(One)?Two(Three)?\b/

答案 1 :(得分:0)

也许这个但不确定 -

 # \b(?=..)q?we?\b

 \b 
 (?= . . )
 q? w e? 
 \b