Python多处理过程导致Parent空闲

时间:2017-05-24 20:21:12

标签: python parent-child python-multiprocessing multiprocessing-manager

我的问题与this question here非常相似,除了捕捉的解决方案对我没有用。

问题:我使用多处理来并行处理文件。大约97%,它的工作原理。但是,有时,父进程将永远空闲,CPU使用率显示为0。

以下是我的代码的简化版

from PIL import Image
import imageio
from multiprocessing import Process, Manager

def split_ranges(min_n, max_n, chunks=4):
    chunksize = ((max_n - min_n) / chunks) + 1
    return [range(x, min(max_n-1, x+chunksize)) for x in range(min_n, max_n, chunksize)]

def handle_file(file_list, vid, main_array):
    for index in file_list:
        try:
            #Do Stuff
            valid_frame = Image.fromarray(vid.get_data(index))
            main_array[index] = 1
        except:
            main_array[index] = 0

def main(file_path):
    mp_manager = Manager()
    vid = imageio.get_reader(file_path, 'ffmpeg')
    num_frames = vid._meta['nframes'] - 1

    list_collector = mp_manager.list(range(num_frames)) #initialize a list as the size of number of frames in the video

    total_list = split_ranges(10, min(200, num_frames), 4) #some arbitrary numbers between 0 and num_frames of video

    processes = []
    file_readers = []

    for split_list in total_list:
        video = imageio.get_reader(file_path, 'ffmpeg')
        proc = Process(target=handle_file, args=(split_list, video, list_collector))
        print "Started Process" #Always gets printed
        proc.Daemon = False
        proc.start()
        processes.append(proc)
        file_readers.append(video)

    for i, proc in enumerate(processes):
        proc.join()
        print "Join Process " + str(i) #Doesn't get printed
        fd = file_readers[i]
        fd.close()

    return list_collector

问题是我可以看到流程开始,我可以看到所有项目都在处理中。但是,有时,这些过程不会重新加入。当我回来看时,只有父进程在那里,但它就像在等待某事一样空转。没有任何子进程存在,但我不认为加入被调用,因为我的打印语句没有显示。

我的假设是,这种情况发生在有大量破帧的视频中。但是,重现此错误有点困难,因为它很少发生。

编辑:代码现在应该有效。试图找到可以重现此错误的文件。

0 个答案:

没有答案