SSE1使用divps内部xmmintrin.h来划分四个32位浮点数并使用printf?

时间:2013-07-03 00:53:04

标签: c++ g++ sse intrinsics

我需要帮助将四个数字分开作为示例并打印它们。我正在使用g ++作为我的编译器。以下代码使用-msse3 -mmmx标志进行编译,我甚至不确定我是否需要这些标志,但它有效。我知道在分割之前我必须使用函数调用来set数字但是我不肯定要调用哪个函数(我认为链接只有int的设置函数)。如果有办法使用std::cout打印结果会更好,但printf可以正常工作(我不确定print128_num是否适合这种情况,它是最初为int写的。这是代码。

#include <emmintrin.h>
#include <xmmintrin.h>
#include <stdio.h>
#include <stdint.h>

void print128_num(__m128i var)
{
    uint16_t *val = (uint16_t*) &var;
    printf("Numerical: %i %i %i %i %i %i %i %i \n",
       val[0], val[1], val[2], val[3], val[4], val[5],
       val[6], val[7]);
}
__m128 divide_4_32_bit_values(__m128 __A, __m128 __B)
{
    return _mm_div_ps (__A, __B);
}
int main(void)
{


    return 0;
}

1 个答案:

答案 0 :(得分:3)

我已经修复了一些问题,我认为现在可以做到你想要的:

#include <xmmintrin.h>
#include <stdio.h>

void print128_num(const char * label, __m128 var)
{
    float *val = (float *) &var;
    printf("%s: %f %f %f %f\n",
       label, val[0], val[1], val[2], val[3]);
}

__m128 divide_4_32_bit_values(__m128 __A, __m128 __B)
{
    return _mm_div_ps (__A, __B);
}

int main(void)
{
    __m128 v1 = _mm_set_ps(4.0f, 3.0f, 2.0f, 1.0f);
    __m128 v2 = _mm_set_ps(1.0f, 2.0f, 3.0f, 4.0f);
    __m128 v = divide_4_32_bit_values(v1, v2);

    print128_num("v1", v1);
    print128_num("v2", v2);
    print128_num("v ", v);

    return 0;
}

测试:

$ gcc -Wall -msse3 m128_print.c 
$ ./a.out
v1: 1.000000 2.000000 3.000000 4.000000
v2: 4.000000 3.000000 2.000000 1.000000
v : 0.250000 0.666667 1.500000 4.000000
$