是否可以在python中并行化此循环?

时间:2018-10-16 13:13:27

标签: python parallel-processing cryptography crc32

我一直在研究使用crc32散列来获取rainbow table的程序。

程序的主循环如下:

from zlib import crc32
from string import ascii_lowercase
from itertools import product

...

rt = {}
i = 0
for p in product(ascii_lowercase, repeat = 8):
    i += 1
    print('\n%d' % i)
    p = ''.join(p)
    print('\nCurrent password = %s' % p)
    r = bytes(p, 'utf-8')
    h = hex(crc32(r))
    for j in range(2**20):
        h = list(h)
        del h[0]
        del h[0]
        for k in range(0, len(h)):
            if (h[k].isdigit()):
                h[k] = chr(ord(h[k]) + 50)
        h = ''.join(h)
        r = bytes(h, 'utf-8')
        h = hex(crc32(r))
    h = list(h)
    del h[0]
    del h[0]
    h = ''.join(h)
    print('\nFinal hash = %s\n' % h)
    rt[p] = h
    if (i == 2**20):
        break

因此,代码按我的预期工作,当退出循环时,它将生成的Rainbow表(变量rt)存储到内存中。好了,上面的代码中显示了当前的迭代次数,要花几天时间才能完成其执行,因此我需要创建该表以及通过循环进行其他迭代的其他表,以便对他们。

我认为尝试并行化它是一个好主意,但是在浏览multiprocessing上的文档并浏览了有关它的一些文章之后,我仍然无法正确地并行化它方式。

谢谢!

1 个答案:

答案 0 :(得分:0)

尝试一下:

from zlib import crc32
from string import ascii_lowercase
from itertools import product
from multiprocessing.pool import Pool

def table(p):
    p = ''.join(p)
    r = bytes(p, 'ascii')
    h = hex(crc32(r))
    for j in range(2**20):
        h = list(h)
        del h[0]
        del h[0]
        for k in range(0, len(h)):
            if (h[k].isdigit()):
                h[k] = chr(ord(h[k]) + 50)
        h = ''.join(h)
        r = bytes(h, 'ascii')
        h = hex(crc32(r))
    h = list(h)
    del h[0]
    del h[0]
    h = ''.join(h)

    return (p, h)

if __name__ == "__main__":
    rt = {}
    i = 0
    with Pool(4) as pool:
        for p, h in pool.imap_unordered(table, product(ascii_lowercase, repeat = 8)):
            print('\n%d' % i)
            print('\nCurrent password = %s' % p)
            print('\nFinal hash = %s\n' % h)
            i += 1
            rt[p] = h
            if i == 2**20:
                break

请注意,由于计算任务的任意顺序,最终中断条件i == 2**20可能工作不正确。