在使用GCC进行自动并行化时,我必须给出哪些标志?是否有使用autopar和石墨的单独标志?我知道没有任何优化是-O0,但具体而言是自动并行化而不是一般优化(预先计算的结果等)
答案 0 :(得分:1)
Apparently -floop-interchange -floop-strip-mine -floop-block
是使用Graphite的人; Autopar通过-floop-parallelize-all -ftree-parallelize-loops=X
启用,其中X
是在并行循环时产生的最大线程数量(根据this,两者都需要)。
所有这些都未在-O3
处自动启用(无论如何都要通过,因为它可以启用其他重要的优化)。