我只使用PCRE进行了此操作,但我希望它能够与Javascript的RegExp一起使用。那,和正则表达式是丑陋的。还有其他更实用的方法吗?
请注意,虽然主题是“OneTwoThree”,但为了简洁,我使用“qwe”。
$ cat test.txt | grep -oP '\b(q(\g<we>|\g<w>)|(?<we>(?<w>w)e))\b'
qwe
qw
we
文件test.txt包含:
qwe qw we q w e qq qe wq ww eq ew ee qqq qqw qqe qwq qww qeq qew qee wqq wqw wqe wwq www wwe weq wew wee eqq eqw eqe ewq eww ewe eeq eew eee
(只有前三个匹配。)
答案 0 :(得分:4)
这样的东西适用于您的样本数据:
/\b(qwe?|we)\b/
/\b(q?we|qw)\b/
您可以测试here。
但是对于你在标题中指定的完整模式,它将是
/\b(OneTwo(Three)?|TwoThree)\b/
/\b((One)?TwoThree|OneTwo)\b/
现在,这不是更具可读性,但它确实略微减少了冗余:
/\b(?!w\b)q?we?\b/
您可以测试here
或者您的完整模式:
/\b(?!Two\b)(One)?Two(Three)?\b/
答案 1 :(得分:0)
也许这个但不确定 -
# \b(?=..)q?we?\b
\b
(?= . . )
q? w e?
\b