我的问题与“How to improve searching with os.walk and fnmatch”有些相关,但我想稍微扩展一下。
假设我们在硬盘上有一个文件集,大约10-50 TB。我想定期查找具有特定结尾的所有文件。在添加新文件时,该集合每天都会更改。在第一次运行中,我想存储获得的信息,以便在以下运行中只需要搜索已更改的文件,我理解为文件系统的某种索引,并希望大大加快每次连续搜索。 / p>
我更喜欢在python中工作,但非常感谢提示现成的软件解决方案以及其他语言的开源项目。