有人可以向我解释以下内容吗?
以下是最小长度ARM指令序列,它将R1乘以常量0x0110 003F
而不使用乘法指令
ADD r2, r1, r1, LSL #4 //r2 = 0x11 * r1
RSB r3, r1, r1, LSL #6 //r3 = 0x3F * r1
ADD r3, r3, r2, LSL #20 //r3 = 0x0110 003F * r1
我不确定为什么使用0x11
和0X3F
获取0x0110 003F
任何熟悉ARM体系结构或hex的人都能为我解释一下这个程序吗?为什么使用RSB?
答案 0 :(得分:5)
数学与ARM无关......
ADD r2,r1,r1, LSL #4 r2 = r1 + (r1 << 4);
RSB r3,r1,r1, LSL #6 r3 = (r1 << 6) - r1;
ADD r3,r3,r2, LSL #20 r3 = r3 + (r2 << 20);
还记得小学的倍增吗?
123
x 12
=====
246
+123
=====
1476
现在关于二进制乘法的一个非常酷的事情是你要么将数字乘以1或0(每个幂2)。在one列上方的十进制数学中,base(10)到power 0,其中有一个2。在二进制(基数2)中,我们不会有这种情况。对于数十列(基数到幂1),就像我们将在二进制中看到的那样,取最顶部的数字并将其乘以基数到幂1(向左移一个位置)并将其加到/累加到结果中。 / p>
所以,如果我想要,在基数2(二进制)中将某些东西乘以0b1011,我设置了位3,1和0,
result = (x<<3) + (x<<1) + (x<<0);
乘以0x0110003F,我们可以为每个8位
添加一个result = (r1<<24)+(r1<<20)+(r1<<5)...
但我们可以使用更基本的数学。
rx * 0x3F
0x3F = 0x40 -1
rx * 0x3F = rx * (0x40 - 1)
distribute
rx * 0x3F = (rx * 0x40) - (rx * 1)
rx * 0x3F = (rx * 0x40) - rx
we know from the comments above that
rx * 0x40 = rx << 6
rx * 0x3F = (rx << 6) - rx
现在
ADD r2,r1,r1,lsl 4 r2 = r1 + (r1 << 4)
r2 = r1 + (r1 << 4)
r2 = r1 + (r1 * 0x10)
r2 = (r1 * 1) + (r1 * 0x10)
r2 = r1 * (1 + 0x10)
r2 = r1 * 0x11
所以
r3 = r1 * 0x3F
r2 = r1 * 0x11
最后一步是
result = r3 + (r2<<20)
result = (r1 * 0x3F) + ((r1*0x11)<<20)
result = (r1 * 0x3F) + ((r1*0x11)*0x100000)
result = (r1 * 0x3F) + (r1*0x1100000)
result = r1 * (0x3f + 0x1100000)
result = r1 * 0x110003F
使用反向减法的原因是因为执行
r3 = (r1 << 6) - r1
使用ARM指令的可以通过以下两种方式完成:
mov r3,r1,lsl 6 r3 = (r1 << 6)
sub r3,r3,r1 r3 = r3 - r1
或
rsb r3,r1,r1,lsl 6 r3 = (r1 << 6) - r1
rsb只表示反向减法,正常减法
sub ra,rb,rc means ra = rb - rc
反向减法意味着反转操作数的顺序
rsb ra,rb,rc means ra = rc - rb
对这样的三种寄存器格式进行臂上操作数的移位,它必须是最后一个操作数,所以如果你想要减去左减操作数,那么使用rsb。
sub ra,rb,rc,lsl x means ra = rb - (rc << x)
rsb ra,rb,rc,lsl x means ra = (rc << x) - rb
我们希望rsb表单保存指令。
答案 1 :(得分:0)
以下是伪代码(和小数)的行:
r2 = r1 + (r1 <<4) == r1 * 16 + r1 == r1 * 17
r3 = r1 << 6 - r1 = r1 * 64 - r1 = r1 * 63
r3 = r3 + r2 << 20 = r3 + r2 * 1048576
将第1行和第2行代入3:
r3 = (r1 * 63) + 1048576 * (17 * r1) = r1 * (63 + 17825792) = r1 * 17825855
...十六进制中的17825855
是110003F
!
要回答关于为什么使用这些数字的问题,它将与Peasant Multiplication相关,并且分解为移位和添加。 110003F
的常量值实际上是这样的:
(2 4 + 1)* 2 20 + 2 6 - 1
答案 2 :(得分:0)
如果您熟悉C,这里是逐行翻译(使用变量而不是寄存器):
r2 = r1 + (r1 << 4);
r3 = (r1 << 6) - r1;
r3 = r3 + (r2 << 20);
回想一下,r1 << 4
与r1 * 16
相同,因此第一行显示r2 = r1 + r1*16
或r2 = r1*17
。
同样,r1 << 6
为r1 * 64
,因此第二行显示r3 = r1 * 64 - r1
或r3 = r1*63
。
遵循相同的模式,最后一行显示r3 = r3 + r2 * 1048576
,替换前一行的值为r3 = r1*63 + r1*17*1048576
。这简化为r3 = 17825855 * r1
或r3 = 0x0110003f * r1
。