我要编写的ARMv7汇编函数遇到问题。该功能如下。
.global maxF32
// float maxF32(const float x[], uint32_t count)
// returns the maximum value in the array (x) containing count entries
/* R0 = float x[], R1 = uint32_t count */
maxF32:
CMP R1, #0 @ SET FLAGS OF COUNT
BEQ maxF32_end @ IF COUNT == 0, GO TO END
MOV R2, R0 @ COPY R0 INTO R2
MOV R0, #0 @ ZERO OUT R0
MOV R3, #0 @ ZERO OUT R3
MOV S0, R0 @ ZERO OUT S0
MOV S1, R0 @ ZERO OUT S1
MOV S2, R0 @ ZERO OUT S2
B maxF32_loop @ BRANCH TO LOOP
maxF32_loop:
CMP R1, #0 @ CHECK IF COUNT == 0
BEQ maxF32_end @ IF SO, GO TO END
VLDR.F32 S0, [R2] @ LOAD CURRENT ELEMENT INTO S0
ADD R2, R2, #4 @ INCREMENT VECTOR POINTER
VLDR.F32 S1, [R2] @ LOAD NEXT ELEMENT INTO S1
SUB R1, R1, #1 @ DECREMENT COUNT
CMP S0, S1 @ SET FLAGS; CHECK S0 - S1
BMI maxF32_update @ IF RESULT IS NEGATIVE (S1 > S0), GO TO UPDATE GREATEST
B maxF32_loop @ REPEAT LOOP
maxF32_update:
VMOV R3, R1, S1 @ MOVE GREATER INTO GREATEST REGISTER
B maxF32_loop @ GO BACK TO LOOP
maxF32_end:
MOV R0, R3 @ COPY GREATEST INTO R0
BX LR @ RETURN
我使用以下C代码进行测试:
extern float maxF32(const float x[], uint32_t count);
#define COUNT 3
float x[] = {1.2, 1.3, 1.4};
float result;
result = maxF32(x, COUNT);
printf("result is %lf\n", result);
使用gdb,在数组的倒数第二个或最后一个循环附近,我在CMP S0, S1
行附近收到“总线错误”。有时,我在MOV R3, R1, S1
处也会收到“预期逗号”,这使我感到困惑,因为我不知道在哪里需要额外的逗号。
最后,我正在使用Raspberry Pi Model 3 B +进行编码。
感谢所有帮助。
答案 0 :(得分:1)
如果计数为“ 3”,则将s0与s1进行3次比较...。这意味着您在数组中查找四个元素。 (使用n
元素,您实际上只应该进行n-1
比较)
逻辑...
decrement count
cmp element0 element1 ... loop
decrement count
compare element1 element2 ... loop
decrement count
compare element2 with 'bus error' -- nothing there.
将SUB R1, R1, #1
移动到maxF32_loop:
之后的第一行可能会解决它,因为它会将减量放在计数为0的检查之前。