pmap对于玩具示例来说很慢

时间:2016-05-14 02:23:25

标签: parallel-processing julia pmap

我正在测试Julia中的并行性,看看我的机器上是否有加速(我正在选择一种语言来实现新的算法)。我不想花大量时间写一个大样本,所以我在发布版Julia 0.4.5(Mac OS X和双核)上做了以下测试:

$ julia -p2

julia> @everywhere f(x) = x^2 + 10
julia> @time map(f, 1:10000000)
julia> @time pmap(f, 1:10000000)

pmap明显慢于地图(> 20x)并且分配超过内存的10倍。我做错了什么?

感谢。

1 个答案:

答案 0 :(得分:9)

这是因为pmap旨在为每个核心进行繁重的计算,而不是很多简单的计算。如果你使用简单的东西作为你的功能,沿着proccesors移动信息的开销大于优点。相反,测试此代码(我在i7中使用4个核心运行它):

function fast(x::Float64)
    return x^2+1.0
end

function slow(x::Float64)
    a = 1.0
    for i in 1:1000
        for j in 1:5000
            a+=asinh(i+j)
        end
    end
    return a
end

info("Precompilation")
map(fast,linspace(1,1000,1000)) 
pmap(fast,linspace(1,1000,1000))
map(slow,linspace(1,1000,10)) 
pmap(slow,linspace(1,1000,10))

info("Testing slow function")
@time map(slow,linspace(1,1000,10)) #3.69 s
@time pmap(slow,linspace(1,1000,10)) #0.003 s
info("Testing fast function")
@time map(fast,linspace(1,1000,1000)) #52 μs
@time pmap(fast,linspace(1,1000,1000)) #775 s

对于许多非常小的迭代的并行化,您可以使用@parallel,在文档中搜索它。