当我尝试编写Heron算法来从ECX寄存器中计算sqrt时,它不起作用。看起来问题是划分浮点数,因为结果是整数。
我的算法:
sqrtecx:
MOV EDX, 10 ; loop count
MOV EAX, 5 ; x_0 in heron algorythm
MOV DWORD[EBP-100], ECX ; save INPUT (ecx is input)
MOV DWORD[EBP-104], EDX ; save loop count
jmp loop
MOV ECX, EAX ; move OUTPUT to ECX
loop:
MOV DWORD[EBP-104], EDX ; save loop count
xor edx, edx
MOV ECX, EAX
MOV EAX, DWORD[EBP-100]
DIV ECX
ADD EAX, ECX
XOR EDX, EDX
mov ecx, 2
DIV ecx
MOV EDX, DWORD[EBP-104] ; load loop count
DEC EDX
JNZ loop
答案 0 :(得分:8)
您需要使用浮点指令集来实现您的目标。您可能会发现一些有用的说明是:
fild <int> - loads and integer into st0 (not an immediate
faddp - adds st0 to st1, and pop from reg stack (i.e. result in st0)
fdivp - divides st0 by st1, then pop from reg stack (again, result in st0)
这是一个简短的示例代码段(VS2010内联汇编):
int main(void)
{
float res;
__asm {
push dword ptr 5; // fild needs a memory location, the trick is
fild [esp]; // to use the stack as a temp. storage
fild [esp]; // now st0 and st1 both contain (float) 5
add esp, 4; // better not screw up the stack
fadd st(0), st(0); // st0 = st0 + st0 = 10
fdivp st(1), st(0); // st0 = st1 / st0 = 5 / 10 = 0.5
sub esp, 4; // again, let's make some room on the stack
fstp [esp]; // store the content of st0 into [esp]
pop eax; // get 0.5 off the stack
mov res, eax; // move it into res (main's local var)
add esp, 4; // preserve the stack
}
printf("res is %f", res); // write the result (0.5)
}
修改强>
正如哈罗德指出的那样,还有一条直接计算平方根的指令,它是fsqrt
。操作数和结果都是st0
。
编辑#2:
我不确定你是否真的可以加载到st0
立即值,因为reference没有明确说明。因此我做了一个小片段来检查,结果是:
float res = 5.0 * 3 - 1;
000313BE D9 05 A8 57 03 00 fld dword ptr [__real@41600000 (357A8h)]
000313C4 D9 5D F8 fstp dword ptr [res]
这些是357A8h
的字节:
__real@41600000:
000357A8 00 00 add byte ptr [eax],al
000357AA 60 pushad
000357AB 41 inc ecx
所以我必须得出结论,遗憾的是,在加载和存储它们时,你必须将数字存储在主存储器中的某个位置。当然,如上所述使用堆栈不是强制性的,实际上您也可以在数据段或其他地方定义一些变量。
编辑#3:
别担心,汇编是一个强大的野兽;)关于你的代码:
mov ecx, 169 ; the number with i wanna to root
sub esp, 100 ; i move esp for free space
push ecx ; i save value of ecx
add esp,4 ; push was move my ebp,then i must come back
fld ; i load from esp, then i should load ecx
fsqrt ; i sqrt it
fst ; i save it on ebp+100
add esp,100 ; back esp to ebp
您错过了fld
和fst
的操作数。看看你的评论我想你想要fld [esp]
和fst [esp]
,但我不明白你为什么要谈论ebp
。 ebp
应该保持堆栈帧的开头(那里有很多我们不应该搞砸的东西),而esp
保持它的结束。我们基本上想要在堆栈框架的末尾进行操作,因为在它之后只有垃圾无人问津
在计算并保存平方根之后,最后还应add esp, 4
。这是因为push ecx
还会sub esp, 4
为您提供的价值腾出空间,并且在保存价值时仍需要一些空间。只有这样,您还可以避免sub esp, 100
和add esp, 100
,因为push
已经为您制作了房间。
最后一个“警告”:整数和浮点值以非常不同的方式表示,因此当您知道必须使用这两种类型时,请注意您选择的指令。您建议的代码使用fld
和fst
,它们都对浮点值进行操作,因此您得到的结果将不是您期望的结果。一个例子? 00 00 00 A9是169上的字节表示,但它代表浮点数+ 2.3681944047089408e-0043(对于那些挑剔的人来说它实际上是一个很长的双倍)。
所以,最终的代码是:
mov ecx, 169; // the number which we wanna root
push ecx; // save it on the stack
fild [esp]; // load into st0
fsqrt; // find the square root
fistp [esp]; // save it back on stack (as an integer)
// or fst [esp] for saving it as a float
pop ecx; // get it back in ecx
答案 1 :(得分:5)
DIV
用于整数除法 - 对于浮点数需要FDIV
(或者在这种特殊情况下更可能FIDIV
,因为它看起来像是以整数值开头)。
答案 2 :(得分:4)
我不完全确定你真正想做什么,所以现在我假设你想要取一个整数的浮点平方根。
mov dword ptr[esp],ecx ; can't load a GRP onto the FPU stack, so go through mem
fild dword ptr[esp] ; read it back (as integer, converted to float)
fsqrt ; take the square root
第一个dword ptr
可能是可选的,具体取决于您的汇编程序。
在此代码之后,结果位于FPU堆栈的顶部,ST(0)。之后我不知道你想用它做什么..如果你想把它变成一个int并把它放回ecx中,我会建议:
fistp dword ptr[esp] ; again it can't go directly, it has to go through mem
mov ecx,dword ptr[esp]
我会采用SSE2的方式进行衡量:
cvtsi2sd xmm0,ecx ; convert int to double
sqrtsd xmm0,xmm0 ; take the square root
cvtsd2si ecx,xmm0 ; round back to int (cvttsd2si for truncate instead of round)
这样有点容易。