GCC发布ARM idiv指令(续)

时间:2014-02-25 11:32:42

标签: android gcc arm

我想知道这对于Krait 400 CPU是否可行。我遵循了一些建议 here

当我使用mcpu = cortexa15编译时,代码编译并有效地在程序集转储中看到udiv指令。

但是,我想知道:

  1. 是否有可能使用march = armv7-a? (没有指定cpu;这就是我原来的方式)
  2. 我尝试使用mcpu = krait2,但由于我没有使用snapdragon llvm(我不知道会有多少努力)但它无法识别它。是否有可能从llvm获取cpu定义并以某种方式使其可用于我的编译器?
  3. 任何其他方法/补丁/技巧?
  4. 我的编译器选项如下:

     /development/android-ndk-r8e/toolchains/arm-linux-androideabi-4.7/prebuilt/linux-x86_64/bin/arm-linux-androideabi-gcc  -DANDROID -DNEON -fexceptions -Wno-psabi --sysroot=/development/android-ndk-r8e/platforms/android-14/arch-arm -fpic -funwind-tables -funswitch-loops -finline-limit=300 -fsigned-char -no-canonical-prefixes -march=armv7-a -mfloat-abi=softfp -mfpu=neon -fdata-sections -ffunction-sections -Wa,--noexecstack  -marm -fomit-frame-pointer -fstrict-aliasing -O3 -DNDEBUG
    

    我得到的错误是:

    Error: selected processor does not support ARM mode `udiv r1,r1,r3'
    

    作为旁注,我必须说我刚刚开始了解整个计划,因此我想保持一小步,以了解我在做什么。

    提前致谢。

    编辑1

    我尝试编译一个单独的模块,只包括udiv指令。该模块使用-mcpu = cortex-a15参数进行编译,而应用程序的其余部分使用-march = armv7-a参数进行编译。结果(以某种方式预期)函数调用开销影响了应用程序的时间性能。我无法获得内联代码,因为tring进入内联导致了我原来的错误。在尝试重新发明轮子之前,我将切换到Snapdragon以查看是否有更好的性能。感谢大家的回答和提示。

1 个答案:

答案 0 :(得分:3)

idiv - 支持sdivudiv的混合使用是一个可选的 Cortex-A 指令。可以通过ID_ISAR0 cp15寄存器以位[27:24]查询 Cortex-A 的支持。

  /* Get idiv support. */
  unsigned int ISAR0;
  int idiv;
  __asm ("mrc 15, 0, %0, c0, c2, 0" :"=r" (ISAR0));
#ifdef __thumb2__
  idiv = (ISAR0 & 0xf000000UL) ? 1 : 0;
#else
  idiv = (ISAR0 & 0xf000000UL) == 0x2000000UL ? 1 : 0;
#endif

位[27:24]为0001,如果只有thumb2支持udivsdiv指令。如果位[27:24]是0010,则两种模式都支持指令。

由于gcc标志-march=armv7-a等意味着代码应该在这种类型的 ALL CPU上工作,并且该指令是可选的,因此gcc发出此指令将是错误的

您可以使用不同的标志编译不同的模块,例如

gcc -march=armv7-a -o general.o -c general.c 
gcc -mcpu=cortex-a15 -D_USE_IDIV_=1 -o fast_idiv.o -c fast_div.c 

这些模块可以链接在一起,上面的代码可以用来在运行时选择合适的例程。例如,两个文件都可以有,

  #include "fir_template.def"

这个文件可能有,

#ifdef _USE_IDIV_
  #define _FUNC(x) idiv_ ## x
#else
  #define _FUNC(x) x
#endif

int _FUNC(fir8)(FILTER8 *filter, SAMPLE *data,)
{
   ....
}

如果您知道您的代码只能在 Cortex-a15 上运行,请使用-mcpu选项。如果你希望它运行得更快 IF 它可以是通用的(支持所有armv7-a CPU),那么你必须按照上面的描述对CPU进行ID识别并动态选择代码。

附录:上面的文件( general.c fast_idiv.c )可以放在具有相同API的单独共享库中。然后询问/proc/cpuinfo并查看是否支持idiv。将LD_LIBRARY_PATH(或dlopen())设置为适当的版本。选择将取决于涉及多少代码。