所以,我试图使用一些汇编代码添加两个向量,但我遇到了问题:
sse_vector4_add(set_vector(2,2,2,2),set_vector(4,2,4,2));
我不确定如何将这些向量传递给该函数。
typedef struct vector4 {
float x, y, z, w;
} vector4;
// Set values to a vector4
vector4 set_vector(float x, float y, float z, float w) {
vector4 ret_vector = { x, y, z, w };
return ret_vector;
}
// Use sse to add the elements of two vectors a + b
vector4 sse_vector4_add(vector4 *op_a,vector4 *op_b) {
vector4 ret_vector;
asm(
"mov %%eax,op_a \n" // Load pointers into CPU regs
"mov %%ebx,op_b \n"
"movups %%XMM0,(%%EAX) \n" // Move the vectors to SSE regs
"movups %%XMM1,(%%EBX) \n"
"addps %%XMM0,%%XMM1 \n" // Add elements
"movups (ret_vector),%%XMM0 \n" // Save the return vector
:
);
return ret_vector;
}
void main() {
// Add two vectors
sse_vector4_add(set_vector (2,2,2,2),set_vector(4,2,4,2));
getchar();
}
函数sse_vector4_add
是由类似的函数构成的,但是在C ++中。
答案 0 :(得分:2)
使用set_vector
初始化变量创建变量。然后,将他们的地址传递给函数。
vector4 a = set_vector(2,2,2,2);
vector4 b = set_vector(4,2,4,2);
vector4 c = sse_vector4_add(&a, &b);