用于评估多个正则表达式的优化

时间:2018-11-19 09:27:30

标签: regex algorithm optimization

提供了一组正则表达式,例如:{r'abc',r'ab[^cd]',r'.bd'}。有没有一种方法可以将它们组合成“正则表达式树/非循环有向图”。对于小例子,它看起来像:

root (r'')  ->: n1, n2;
n1   (r'ab') ->: n3, n4;
n2   (r'.bd' or r'[^a]bd') ->: matched r'.bd'
n3   (r'c') ->: matched r'abc'
n4   (r'd') ->: matched r'.bd'
n5   (r'.' or r'[^cd]') ->: matched r'ab[^cd]'

或与此类似的内容,以便可以使用以前的正则表达式的部分匹配来评估下一个正则表达式。

0 个答案:

没有答案