在同一个大文件中加速许多字符串搜索?

时间:2018-06-11 09:21:37

标签: python linux sorting search grep

我有大约200GB的数据,我试图在里面搜索各种字符串(主要使用grep或python正则表达式)。现在,每次我想出一个新字符串时,要花费很长时间来查看所有这些文件以查看是否有任何匹配。是否有任何聪明的算法或Linux实用程序可以帮助索引/存储有关这些文件内容的已排序元数据,以便我可以预先做一些繁重的计算工作,然后在将来更快地搜索?

0 个答案:

没有答案