使用多个tqdm进度条进行多处理

时间:2017-09-28 09:07:54

标签: python csv python-multiprocessing tqdm

我有多个并行处理的大型csv文件。我希望每个文件都有一个进度条。

然而,当我显示5个条形图时,只有最后一个条形图正在更新 - 似乎所有进程都会立即更新。因为我无法将整个csv文件读入内存,所以我使用filesize来显示进度。

inputArg是以数字结尾的文件夹路径。

def worker(inputArg):
        with open(inputArg + '/data.csv') as csvfile:
                size = os.path.getsize(inputArg + '/data.csv')
                text = "progresser #{}".format(inputArg[-1])
                pb = tqdm(total=size, unit="B", unit_scale=True, desc=text, position=int(inputArg[-1]))
                reader = csv.reader(csvfile, delimiter=',')
                for row in reader:
                        pb.update(len(row))
                        session.execute(*INSERT QUERY*)

    def scheduler(inputData):
            p = multiprocessing.Pool(multiprocessing.cpu_count()+1)
            p.map(worker, inputData)
            p.close()
            p.join()

    if __name__ == '__main__':
            folders = glob.glob('FILEPATH/*')
            print ('--------------------Insert started---------------')
            scheduler(folders)
            print('---------------------All Done---------------------')

任何提示都将不胜感激!

编辑:我确实检查了另一个答案,但我明确表示我想要多个进度条,而答案只给你一个。因此,这不是重复。

EDIT2:这里看起来像@bouteillebleu,我确实得到了我的酒吧,但只有最后一个因为某些原因而更新了。 Current progress bars

1 个答案:

答案 0 :(得分:0)

尝试使用最新版本的tqdmv4.18.0或更高版本,请参阅https://github.com/tqdm/tqdm/releases