我有一个使用libpuzzle库的cilk程序。我的任务是根据它们的相似性并行化图像的排序,我使用并行cilk for循环来比较所有图像和参考图像。我注意到的是,在程序的第一次运行中,执行速度很慢,但是在第二次运行之后,它加速了,我可以看到所有逻辑内核都在100%运行...我每次构建项目时都会重复这个总是ra两次运行,可以看到这种表现。任何想法可能会导致并行程序在第一次运行时运行稍差并且在第二次运行时运行良好。我也改变了图像分布,这个模式似乎成立了。如果有人有类似的经历,请你分享你为解决问题所做的工作?
谢谢