Question

我正在学习python中的并行处理，我对以下程序的执行流程有一些非常具体的疑虑。在这个程序中，我根据流程将我的列表分成两部分。我的目标是两次并行地运行add函数，其中一个进程占用列表的一部分而另一个进程占用其他部分。

import multiprocessing as mp
x = [1,2,3,4]

print('hello')
def add(flag, q_f):
    global x
    if flag == 1:
        dl = x[0:2]
    elif flag == 2:
        dl = x[2:4]
    else:
        dl = x
    x = [i+2 for i in dl]
    print('flag = %d'%flag)
    print('1')
    print('2')
    print(x)
    q_f.put(x)

print('Above main')

if __name__ == '__main__':
    ctx = mp.get_context('spawn')
    print('inside main')
    q = ctx.Queue()
    jobs = []
    for i in range(2):
        p = mp.Process(target = add, args = (i+1, q))
        jobs.append(p)
    for j in jobs:
        j.start()
    for j in jobs:
        j.join()
    print('completed')
    print(q.get())
    print(q.get())

print('outside main')

我得到的输出是

hello
Above main
outside main
flag = 1
1
2
[3, 4]
hello
Above main
outside main
flag = 2
1
2
[5, 6]
hello
Above main
inside main
completed
[3, 4]
[5, 6]
outside main

我的问题是

1）从输出中，我们可以看到一个进程首先执行，然后另一个进程执行。该程序是否实际上使用多个处理器进行并行处理？如果没有，我怎样才能平行处理？如果是平行处理，则打印报告（＆＃39; 1＆＃39;）打印（＆＃39; 2＆＃39;）应该随机执行，对吗？

2）我可以通过编程方式检查程序正在运行的处理器吗？

3）为什么主要（hello，main，main）之外的print语句被执行三次？

4）程序执行的流程是什么？

Answer 1

1）add()的执行速度可能很快，以至于第二个进程启动时第一次执行已经结束。

2）进程通常不会分配给特定的CPU，而是在它们之间跳转

3）如果您为每个启动的进程使用Windows，则必须再次执行该模块。对于这些执行，__name__不是'main'，而是执行所有无条件命令（在if之外等），例如这些print。

4）当在Windows上调用start()的{{1}}时，会启动一个新的Python解释器，这意味着导入（因此执行）必要的模块，并且运行子流程所需的资源被传递给新的翻译（https://docs.python.org/3.6/library/multiprocessing.html#contexts-and-start-methods中描述的“spawn”方法）。然后所有进程独立运行（如果程序没有进行同步）

python

1 个答案: