跟踪Python中的文件加载进度

时间:2009-01-22 06:44:52

标签: python file load progress

我使用的很多模块将整个文件导入到内存中,或者在处理文件的内容时将其涓涓细流。我想知道是否有办法跟踪这种加载进度?可能是一个需要回调的包装类?

2 个答案:

答案 0 :(得分:7)

我会通过确定文件的大小来做,然后简单地将总数除以读取的字节数。像这样:

import os

def show_progress(file_name, chunk_size=1024):
    fh = open(file_name, "r")
    total_size = os.path.getsize(file_name)
    total_read = 0
    while True:
        chunk = fh.read(chunk_size)
        if not chunk: 
            fh.close()
            break
        total_read += len(chunk)
        print "Progress: %s percent" % (total_read/total_size)
        yield chunk

for chunk in show_progress("my_file.txt"):
    # Process the chunk
    pass 

编辑:我知道这不是最好的代码,但我只想展示这个概念。

答案 1 :(得分:2)

如果您实际上是指“导入”(而不是“读取”),那么您可以覆盖导入模块定义。您可以添加计时功能。

请参阅imp模块。

如果您的意思是“读取”,那么您可以使用自己的文件类包装器轻松地包装Python文件。文件不会暴露太多方法。您可以覆盖有趣的数据以获取时间数据。

>>> class MyFile(file):
...     def read(self,*args,**kw):
...         # start timing
...         result= super(MyFile,self).read(*args,**kw)
...         # finish timing
...         return result