我有多个并行处理的大型csv文件。我希望每个文件都有一个进度条。
然而,当我显示5个条形图时,只有最后一个条形图正在更新 - 似乎所有进程都会立即更新。因为我无法将整个csv文件读入内存,所以我使用filesize来显示进度。
inputArg是以数字结尾的文件夹路径。
def worker(inputArg):
with open(inputArg + '/data.csv') as csvfile:
size = os.path.getsize(inputArg + '/data.csv')
text = "progresser #{}".format(inputArg[-1])
pb = tqdm(total=size, unit="B", unit_scale=True, desc=text, position=int(inputArg[-1]))
reader = csv.reader(csvfile, delimiter=',')
for row in reader:
pb.update(len(row))
session.execute(*INSERT QUERY*)
def scheduler(inputData):
p = multiprocessing.Pool(multiprocessing.cpu_count()+1)
p.map(worker, inputData)
p.close()
p.join()
if __name__ == '__main__':
folders = glob.glob('FILEPATH/*')
print ('--------------------Insert started---------------')
scheduler(folders)
print('---------------------All Done---------------------')
任何提示都将不胜感激!
编辑:我确实检查了另一个答案,但我明确表示我想要多个进度条,而答案只给你一个。因此,这不是重复。EDIT2:这里看起来像@bouteillebleu,我确实得到了我的酒吧,但只有最后一个因为某些原因而更新了。 Current progress bars