我想在汇编语言中对矩阵的操作提供一些帮助。 我的代码在C和ASM中进行Cholesky分解并比较它们的速度。 我已经创建了嵌套循环并且它工作正常,因此我不知道如何正确地使用矩阵来访问其元素。矩阵在C中是DOUBLE,我设法将其地址(第一个元素)转换为汇编。
Cholesky_double proc \
tab_addr:DWORD, \ ; begin adres of matrix
num_elem:DWORD ; element count in row/column (n of Matrix[n][n])
LOCAL i:DWORD, k:DWORD, j:DWORD, skoczek:DWORD
;skoczek is for operation count check (ex.should be 13 for 3x3 matrix)
; push register on stack
push edx
push ecx
push ebx
push esi
push edi
mov k, 0
mov skoczek, 0
for0start:
inc skoczek
mov eax, k
mov i, eax
inc i
;there should be MATRIX[k][k] = sqrt(MATRIX[k][k])
mov eax, num_elem
sub eax, i
cmp eax, 0
je for1end
for1start:
inc skoczek
;MATRIX[i][k]=MATRIX[i][k]/MATRIX[k][k]
for1koniec:
inc i
mov eax, num_elem
sub eax, i
cmp eax, 0
jne for1start
for1END:
mov eax, k
mov j, eax
inc j
mov eax, num_elem
sub eax, j
cmp eax, 0
je for2end
for2start:
inc skoczek
mov eax, j
mov i, eax
for3start:
inc skoczek
;MATRIX[i][j] = MATRIX[i][j]-MATRIX[i][k]*MATRIX[j][k]
for3koniec:
inc i
mov eax, num_elem
sub eax, i
cmp eax, 0
jne for3start
for2koniec:
inc j
mov eax, num_elem
sub eax, j
cmp eax, 0
jne for2start
for2end:
for0koniec:
inc k
mov eax, num_elem
sub eax, k
cmp eax, 0
jne for0start
koniec:
pop edi
pop esi
pop ebx
pop ecx
pop edx
mov eax, skoczek
ret
; return with operation count in eax
Cholesky_double endp
矩阵在C中传递
extern "C" int __stdcall Cholesky_double(double* tab_adr, int num_el);
我使用Visual Studio 2010和解决方案与项目创建ASSEMBLY库和项目与C ++中的代码可以使用汇编程序函数。
我不是要求为我填写代码,只是为了帮助正确处理矩阵以正确访问其元素。如果你预见到会遇到更多问题(比如asm中的Sqrt,我会对某些指导感到满意。
答案 0 :(得分:3)
首先必须线性化地址:
&matrix[k][i] = matrix + i*sizeof(double) + k*N*sizeof(double);
其中N是行宽。 (假设NxN矩阵)
可以加载
fld [%eax] // load to top of stack in FPU (assuming ia-32 system)
mov %rbx,[%rax]; // vs. load 64-bit register
movsd %xmm0, [%rax] // vs. load a double to lower 64-bits of xmm register