以分页方式迭代文件列表

时间:2017-03-13 18:15:14

标签: python

我在一个目录中迭代文件,每个目录中有数千个文件。应该通过在存储器和存储器中保持某些预定数量的绝对文件路径来优化存储器使用。其余要以二进制格式缓存在磁盘文件中,并且应该能够寻找所需的记录号。

需要像文件路径为参数的iterator类之类的迭代器。

初始化检查文件存在时(directory.bin)。如果file不存在,则在子文件夹中以递归方式查找所有文件路径,并将它们保存到文件中(directory.bin)

如果存在,则应该从directory.bin

给出no文件路径

我想在python中使用这个场景的程序,我试图这样做,但是无法得到它。任何一个帮助都是赞赏。

这是输入:

目录file_1 file_2 sub / file_11 file_22 other / sub / file_111 file_222

让我们假设上面是一个包含文件的目录。如果我使用目录路径和阈值作为参数调用迭代器

在初始化时,它应递归读取所有absoulte文件路径并保存到二进制文件。稍后调用next()时,它应该从二进制文件中返回阈值文件路径。在next()第二次,应从同一个二进制文件返回下一个阈值文件路径。

下面的假设输出

Ex:FileList(directory_path,10)它应该将所有文件路径保存到directory_path.bin中。下次调用时,应该从directory_path.bin返回no文件路径==在下一次迭代中,前10个文件路径应该从directory_path返回no文件路径。 bin ==第二组10个文件路径

0 个答案:

没有答案