在Python中,如何检查字符串是否与数组中的正则表达式匹配?

时间:2017-05-18 23:39:48

标签: python regex python-3.x

我知道有一些关于在数组中匹配正则表达式的线程:How do you use a regex in a list comprehension in Python?但我不认为这些方法具有很高的可扩展性。

我的问题是如何尽可能高效地进行正则表达式匹配。例如,我下面有一个亵渎词组(总共有2000行):

.*damn
bollock.*
...

(你明白了......)

我想要做的是尽可能快地找出一个句子是否包含任何亵渎语言/模式。通过使用|将所有这些模式连接成一个模式将导致一个超级巨大的模式..有没有人有关于如何在Python中优化它的想法?

1 个答案:

答案 0 :(得分:-1)

我会尝试一下这个库:

https://code.google.com/archive/p/esmre/

  

使用Aho-Corasick

在Python中进行正则表达式加速

或者这个:

https://github.com/WojciechMula/pyahocorasick/