ARM Assembly问题(注册不足!)

时间:2018-11-06 17:47:07

标签: assembly arm cpu-registers

您好,我正在尝试编写代码来进行模式搜索,并对排名前3的最流行模式进行排名,以及对模式进行计数的次数。 我可以编写排名前2位的代码。但我不能做等级3。

(我以此方式分配了寄存器)
    R7:top1模式的计数
    R8:top1模式
    R10:top2模式的计数
    R11:top2模式

这是我可以使用的实际代码

void ex3(){
int result[4];

example3(0x00,0x100, 0x0, result);
sendstr("Top 1 pattern : ");
printDecimal(result[0]);
sendstr("\n");

sendstr("Top 1 pattern count : ");
printDecimal(result[1]);
sendstr("\n");

sendstr("Top 2 pattern : ");
    printDecimal(result[2]);
sendstr("\n");

    sendstr("Top 2 pattern count : ");
printDecimal(result[3]);
sendstr("\n");

}


PRESERVE8
AREA Ex3, CODE, READONLY

EXPORT  example3

example3
    STMFD       sp!,{r4-r9,lr}              
    MOV         R4, r2                          
    MOV         R6, R3
    MOV         R7, #0
    MOV         R8, #0

Loop2   
    MOV         r3, #0                          
    MOV         r9, r0

Loop
    LDRB        r5, [r9], #1                        
    CMP         r4, r5                          
    ADDEQ       r3, r3, #1                      
    CMP         r9, r1                          
    BLS         Loop
    CMP         R3, R7
    BLT         Com2




Com1

    MOVGT   R10,R7
    MOVGT   R11,R8
    MOVGT   R7, R3                          
    MOVGT   R8, R4
    B               Here

Com2
    CMP         R3,R10
    BLT         Here
    MOVGT   R10,R3
    MOVGT   R11,R4


    CMP         R4, #0XFF
    ADDLT       R4, R4, #1
    BLT         Loop2

    STR         r8, [r6]
    STR         r7, [r6,#4]

    STR         r11, [r6,#8]
    STR         r10, [r6,#12]


    LDMFD       sp!,{r4-r9,lr}

    MOV         PC, lr

    END

但是当我尝试使用相同逻辑的等级3代码时,只是以这种方式更改了寄存器分配

r7 count of top1 pattern  
r8 top1 pattern    

r9 top2 count  
r10 TOP2    

r11 top3 count  
r12 top3    

由于(我认为)寄存器分配错误(我需要更多的empy寄存器...),它显示出奇怪的结果。解决注册不足的简单方法或正确方法是什么?

PRESERVE8
AREA Ex3, CODE, READONLY

EXPORT  example3

example3
    STMFD       sp!,{r4-r9,lr}              
    MOV         R4, r2                          
    MOV         R6, R3
    MOV         R7, #0
    MOV         R8, #0

Loop2   
    MOV         r3, #0                          
    MOV         r9, r0

Loop
    LDRB        r5, [r9], #1                        
    CMP         r4, r5                          
    ADDEQ       r3, r3, #1                      
    CMP         r9, r1                          
    BLS         Loop
    CMP         R3, R7
    BLT         Com2




Com1
    MOVGT   R11,R9
    MOVGT   R12,R10
    MOVGT   R9,R7
    MOVGT   R10,R8
    MOVGT   R7, R3                          
    MOVGT   R8, R4
    B               Here

Com2
    CMP         R3,R9
    BLT         Com3
    MOVGT   R11,R9
    MOVGT   R12,R10
    MOVGT   R9,R3
    MOVGT   R10,R4
    B               Here


Com3
    CMP         R3,R11
    MOVGT   R11,R3
    MOVGT   R12,R4


Here
    CMP         R4, #0XFF
    ADDLT       R4, R4, #1
    BLT         Loop2

    STR         r8, [r6]
    STR         r7, [r6,#4]

    STR         r10, [r6,#8]
    STR         r9, [r6,#12]
    STR         r12, [r6,#16]
    STR         r11, [r6,#20]


    LDMFD       sp!,{r4-r9,lr}

    MOV         PC, lr

    END

1 个答案:

答案 0 :(得分:3)

编译器将如何执行?尝试编写一些C来执行相同的操作,并让编译器生成汇编语言(如果使用的是GCC,则为gcc -S)。这是学习有效的汇编语言的好方法。并非编译器曾经做过的所有事情都可能是最高效的,但是它始终可以工作并且合乎逻辑,并且如果禁用了优化,应该相当容易遵循。

如果寄存器用完了,唯一的选择是使用堆栈进行本地存储,并根据需要推送和弹出寄存器,或者分配一些堆栈空间和LDR / STR根据需要来自该区域的值。但是,根据您的情况,您不会从函数内调用任何其他函数,因此没有理由避免r0-r3r12被调用过多。

请注意,您提供的代码至少包含一个错误,因为您正在使用r10-r11,并且没有通过STMFDLDMFD指令保留其内容。