长列表,多个正则表达式和性能

时间:2009-03-10 16:48:23

标签: regex

好的,我有一个很长的列表(大约有43,400行),我想选择这个列表的一个子集。该列表位于数据库中,读取数据库的程序可以使用一个或多个正则表达式。

在对数据库程序的一次调用中使用多个(可能最多100个)正则表达式来从根本上选择我想要的条目是不是更好

OR

最好使用少得多的正则表达式(最多10个)来选择更多的条目到数组然后使用for循环和一些简单的if语句来过滤掉我不是的数据感兴趣?

我已经阅读或听说过最好避免过度使用正则表达式,因为它们的计算成本很高?

2 个答案:

答案 0 :(得分:2)

我会推荐第二种方法,特别是如果你能找到一种方法将正则表达式搜索分成不同的线程并获得一些并发性。划分和征服,宝贝!

答案 1 :(得分:2)

KevDog的回答似乎是正确的前进方向。

我只是想补充一点,你可能想尝试两者并测量性能差异。这样,你就可以消除所有的猜测,它会自然地考虑到你可能拥有的任何我们无法知道的特殊情况。