如何将并行的大项目列表,python混乱

时间:2017-06-30 10:57:33

标签: python algorithm shuffle bigdata

我在python的计算中遇到了瓶颈:我需要改组一个大的列表(~10^9元素)。 目前的实施:

import random
random.shuffle(list)

使用此方法,只涉及一个核心。是否有可能并行地移动大型列表?

1 个答案:

答案 0 :(得分:2)

您可以查看Process课程,可以通过以下方式举例说明:

import random
from multiprocessing import Process


def worker_func(variable_1):
# your code

random.shuffle(list_single)

if __name__ == '__main__':
#Create a process list 
process_list = list()

pid = os.getpid()
print('Main Process is started and PID is: ' + str(pid))

#Start Process
list_example = [[1,2,3], [4, 5, 6], [7, 8, 9]]
for list_single in list_example:
    p = Process(target=worker_func, args=(list_single, ))
    p.start()
    child_pid = str(p.pid)
    print('PID is:' + child_pid)
    process_list.append(child_pid)
    child = multiprocessing.active_children()

while child != []:
    time.sleep(1)
    child = multiprocessing.active_children()

如果您想并行运行此数据,可以使用multithreadingmultiprocessing。您应该定义您的工作者函数并在此过程中调用它。