使用f2py编译Fortran代码时如何使用avx标志?

时间:2016-10-28 21:21:52

标签: python numpy scipy fortran f2py

在Python中进行一些性能测试时,我比较了不同方法的时序,以计算坐标数组之间的欧几里德距离。我发现使用F2PY编译的Fortran代码比SciPy使用的C实现慢大约4倍。将C代码与我的Fortran代码进行比较,我发现没有任何根本的区别会导致4个因素的差异。这是我的代码(有一些注释解释它的用法):

        subroutine distance(coor,dist,n)
        double precision coor(n,3),dist(n,n)
        integer n,i,j
        double precision xij,yij,zij

cf2py   intent(in):: coor,n
cf2py   intent(in,out):: dist
cf2py   intent(hide):: xij,yij,zij,

       do 200,i=1,n-1
           do 300,j=i+1,n
               xij=coor(i,1)-coor(j,1)
               yij=coor(i,2)-coor(j,2)
               zij=coor(i,3)-coor(j,3)

               dist(i,j)=dsqrt(xij*xij+yij*yij+zij*zij)

  300   continue
  200   continue

        end

c         1         2         3         4         5         6         7
c123456789012345678901234567890123456789012345678901234567890123456789012
c
c     to setup and incorporate into python (requires numpy):
c
c     # python setup_distance.py build
c     # cp build/lib*/distance.so ./
c
c     to call this from python add the following lines:
c
c     >>> import sys ; sys.path.append('./')
c     >>> from distance import distance
c
c     >>> dist = distance(coor, dist)

查看F2PY运行的编译命令,我发现没有avx编译标志。我尝试使用extra_compile_args=['-mavx]`在Python安装文件中添加它,但这对F2PY运行的编译命令没有任何改变:

compiling Fortran sources
Fortran f77 compiler: /usr/bin/gfortran -Wall -g -ffixed-form -fno-second-underscore -fPIC -O3 -funroll-loops
Fortran f90 compiler: /usr/bin/gfortran -Wall -g -fno-second-underscore -fPIC -O3 -funroll-loops
Fortran fix compiler: /usr/bin/gfortran -Wall -g -ffixed-form -fno-second-underscore -Wall -g -fno-second-underscore -fPIC -O3 -funroll-loops
compile options: '-I/home/user/anaconda/lib/python2.7/site-packages/numpy/core/include -Ibuild/src.linux-x86_64-2.7 -I/home/user/anaconda/lib/python2.7/site-packages/numpy/core/include -I/home/user/anaconda/include/python2.7 -c'
gfortran:f77: ./distance.f
creating build/lib.linux-x86_64-2.7
/usr/bin/gfortran -Wall -g -Wall -g -shared build/temp.linux-x86_64-2.7/build/src.linux-x86_64-2.7/distancemodule.o build/temp.linux-x86_64-2.7/build/src.linux-x86_64-2.7/fortranobject.o build/temp.linux-x86_64-2.7/distance.o -L/home/user/anaconda/lib -lpython2.7 -lgfortran -o build/lib.linux-x86_64-2.7/distance.so

2 个答案:

答案 0 :(得分:1)

回答如何将avx标志添加到编译器选项中 在你的情况下,f77编译器被选中gfortran:f77: ./distance.f<这是关键路线 您可以尝试指定--f77flags=-mavx

答案 1 :(得分:0)

在评论中,Warren Weckesser解释说,Fortran数组是根据C语言转换而存储的。但是,没有提到一个重要的含义。要以正确的顺序遍历数组,您必须切换循环的顺序。在C中,第一个索引是外部循环,在Fortran中,第一个索引应该是内部循环。您的索引编号为dist(i,j),因此您的循环顺序错误。

但是因为你的j循环取决于i循环值,你可能必须在数组中切换索引的角色(转置它)。

一些编译器能够以足够高的优化级别为您纠正一些简单的循环排序。

众所周知,-funroll-loops通常过于激进,实际上是有害的。通常应该设置一些限制。