我目前正在编写一个程序,该程序遍历大型文件目录并对每个文件执行操作。我的程序的核心循环看起来像这样(它是类结构的一部分):
def processFile(self, path):
handle = open(path)
fileText = handle.read()
result = #some program here, doesn't effect performance
handle.close()
print("Processed: {}".format(path))
return result
使用尽可能多的文件会使程序运行缓慢。但是,如果我在执行中途发出中断,然后再次运行程序,它会在中断之前很快处理已经处理过的文件!
有没有办法提高使用open()的速度? 有没有理由在第二次执行时立即处理先前执行我的程序时处理的文件?
另外 - 我在Mac OSX 10.10.5上运行它