识别等效的正则表达式

时间:2012-05-04 10:15:31

标签: regex

我正在修改考试,其中一个主题是正则表达式。

过去的试卷有问题

  

以下哪个正则表达式是等效的?说明   你的推理。 [8马克]

     

(i)(a + b)* b(a + b)* b(a + b)*

     

(ii)a * b a * b a *

     

(iii)a * b a * b(a + b)*

我认为这是一个技巧问题,答案是否定的,因为

我将接受aabaabaabaabbaabaabaabababaabaabaab但ii和iii不会

然后因为ii只能接受2 b的最大值而iii可以接受2 b的最小值。

我是正确还是我完全错了?

我已经通过电子邮件向我的讲师寻求帮助,但没有回复,所以我希望有人可以提供帮助。

感谢。

1 个答案:

答案 0 :(得分:4)

iiii是等效的。

正则表达式都是“a s和b s的字符串,其中至少有两个b s”(每个定义都应该清楚)。 iii只有a*代替前两个(a+b)*这一事实让人分心。我将分解iii如何描述字符串:

  • 可能为空的a s字符串(下面的标签中为A
  • 第一个bX
  • 另一个可能为空的a s(B
  • 字符串
  • 第二个bY
  • 和其他字符串只是ab s(C)的混合

对于您的示例,iii确实与之匹配。想象一下,我们将正则表达式标记为这样(v^只是箭头):

A  X B  Y   C
vv v vv v vvvvvv 
a* b a* b (a+b)*

然后我们可以标记正则表达式的哪一部分对应于字符串的部分:

  X  Y
  v  v
aabaabaabaabbaabaabaabaabbaabaabaabaab
^^ ^^ ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
A   B            C

(@ Li-aungYip的建议也很好。)