我正在创建一个函数,可以从asm 64位的C代码中调用 这是C等价函数:
/*
* x and y are two arrays of floats, this function calculates the
* distance beetween those two objects
*/
float dist(float *x, float *y, int length)
{
float c = 0;
int i;
for (i = 0; i < length; ++i)
{
c += (x[i] - y[i]) * (x[i] - y[i]);
}
return sqrt(c);
}
这是汇编代码:
section .text
global distanza64
distanza64:
push rbp ; save base pointer
mov rbp, rsp
pushaq ; save general registers
; C function
; float dist(float *x, float *y, int length)
; in xmm0 there is *x, in xmm1 float *y, in rdi there is length
loop:
cmp rdi, 0 ; cycle counter
je end_loop
movss xmm2, [xmm0] ; x[i]
subss xmm2, [xmm1] ; x[i] = x[i] - y[i] i.e (a-b)
mulss xmm2, xmm2 ; x[i] = x[i] * x[i] i.e (a-b)*(a-b)
addss xmm3, xmm2 ; c += x[i] i.e c = (a-b)*(a-b)
addsd xmm0, 8 ; vgo to next address 8*8 = 64-bit
addsd xmm1, 8 ; same as above
dec rdi ; length--
end_loop:
sqrtss xmm3, xmm3 ; c = sqrt(c)
movss xmm0, xmm3 ; in xmm0 there is the final value
popaq
mov rsp, rbp
pop rbp
ret
我使用nasm编译:nasm -f elf64 distanza.asm
问题是当我尝试使用xmm0和xmm1处的地址获取x [i]和y [i]的值时:
movss xmm2, [xmm0]
subss xmm2, [xmm1]
它不会编译:无效的有效地址。 如何使用存储在xmm0中的地址来获取内存中的值?我必须使用xmm0,因为它是存储参数float * x的寄存器。
答案 0 :(得分:2)
float*
是一个指针,它肯定不在xmm0
。
float dist(float * x,float * y,int length)
在xmm0中有* x,在xmm1 float * y中,在rdi中有长度
实际上,rdi
为*x
,rsi
为*y
,rdx
为length
。阅读abi documentation或overview at wikipedia。
64位模式下也不存在pusha/popa
。
答案 1 :(得分:1)
我认为地址只能使用通用寄存器,例如rax
和rip
。在“解除引用”之前,您需要将值移出一个。我必须警告,但是自从我组装以来已经有一段时间了。
修改强>
以下是英特尔手册中的相关部分:
3.7.5.1在64位模式下指定偏移量
64位模式下的存储器地址的偏移部分可以直接指定为静态值或通过地址指定 计算由以下一个或多个组成部分组成:
- 置换 - 8位,16位或32位值。
- Base - 64位通用寄存器中的值。
- 索引 - 64位通用寄存器中的值。
- 比例因子 - 值为2,4或8,乘以指数值。
在大多数情况下,可以在16个可用的通用寄存器之一中指定基值和索引值。看到 英特尔®64和IA-32架构软件开发人员手册卷第2章“指令格式” 2A。
还提供以下独特的地址组件组合。
- RIP +位移⎯在64位模式下,RIP相对寻址使用带符号的32位位移 通过对32位值进行符号扩展来计算下一条指令的有效地址,并添加到64位 RIP中的值。
这与@Jester提到的调用约定问题不同。