我想知道这对于Krait 400 CPU是否可行。我遵循了一些建议 here
当我使用mcpu = cortexa15编译时,代码编译并有效地在程序集转储中看到udiv指令。
但是,我想知道:
我的编译器选项如下:
/development/android-ndk-r8e/toolchains/arm-linux-androideabi-4.7/prebuilt/linux-x86_64/bin/arm-linux-androideabi-gcc -DANDROID -DNEON -fexceptions -Wno-psabi --sysroot=/development/android-ndk-r8e/platforms/android-14/arch-arm -fpic -funwind-tables -funswitch-loops -finline-limit=300 -fsigned-char -no-canonical-prefixes -march=armv7-a -mfloat-abi=softfp -mfpu=neon -fdata-sections -ffunction-sections -Wa,--noexecstack -marm -fomit-frame-pointer -fstrict-aliasing -O3 -DNDEBUG
我得到的错误是:
Error: selected processor does not support ARM mode `udiv r1,r1,r3'
作为旁注,我必须说我刚刚开始了解整个计划,因此我想保持一小步,以了解我在做什么。
提前致谢。
编辑1 :
我尝试编译一个单独的模块,只包括udiv指令。该模块使用-mcpu = cortex-a15参数进行编译,而应用程序的其余部分使用-march = armv7-a参数进行编译。结果(以某种方式预期)函数调用开销影响了应用程序的时间性能。我无法获得内联代码,因为tring进入内联导致了我原来的错误。在尝试重新发明轮子之前,我将切换到Snapdragon以查看是否有更好的性能。感谢大家的回答和提示。
答案 0 :(得分:3)
idiv
- 支持sdiv
和udiv
的混合使用是一个可选的 Cortex-A 指令。可以通过ID_ISAR0
cp15寄存器以位[27:24]查询 Cortex-A 的支持。
/* Get idiv support. */
unsigned int ISAR0;
int idiv;
__asm ("mrc 15, 0, %0, c0, c2, 0" :"=r" (ISAR0));
#ifdef __thumb2__
idiv = (ISAR0 & 0xf000000UL) ? 1 : 0;
#else
idiv = (ISAR0 & 0xf000000UL) == 0x2000000UL ? 1 : 0;
#endif
位[27:24]为0001
,如果只有thumb2支持udiv
和sdiv
指令。如果位[27:24]是0010
,则两种模式都支持指令。
由于gcc标志-march=armv7-a
等意味着代码应该在这种类型的 ALL CPU上工作,并且该指令是可选的,因此gcc发出此指令将是错误的
您可以使用不同的标志编译不同的模块,例如
gcc -march=armv7-a -o general.o -c general.c
gcc -mcpu=cortex-a15 -D_USE_IDIV_=1 -o fast_idiv.o -c fast_div.c
这些模块可以链接在一起,上面的代码可以用来在运行时选择合适的例程。例如,两个文件都可以有,
#include "fir_template.def"
这个文件可能有,
#ifdef _USE_IDIV_
#define _FUNC(x) idiv_ ## x
#else
#define _FUNC(x) x
#endif
int _FUNC(fir8)(FILTER8 *filter, SAMPLE *data,)
{
....
}
如果您知道您的代码只能在 Cortex-a15 上运行,请使用-mcpu
选项。如果你希望它运行得更快 IF 它可以是通用的(支持所有armv7-a CPU),那么你必须按照上面的描述对CPU进行ID识别并动态选择代码。
附录:上面的文件( general.c 和 fast_idiv.c )可以放在具有相同API的单独共享库中。然后询问/proc/cpuinfo
并查看是否支持idiv
。将LD_LIBRARY_PATH
(或dlopen()
)设置为适当的版本。选择将取决于涉及多少代码。