从64位整数类型加载__m64?

时间:2016-04-18 00:58:41

标签: c windows visual-studio-2010 intrinsics sse2

我正在将使用英特尔SSE2内在函数编写的例程移植到Microsoft 32位平台。它在GCC,Clang和64位Windows下运行良好。原始代码有效地执行以下操作:

typedef unsigned __int64 word64;

// input is aligned on 16-byte boundary
void (const byte* input)
{
    const word64 m0 = ((const word64*)input)[ 0];
    const word64 m1 = ((const word64*)input)[ 8];
    ...

    __m128 t0 = _mm_set_epi64x(m0, m1);
}

Microsoft未在32位平台上提供_mm_set_epi64x,因此我想使用_mm_set_epi64

现在问题......首先,

__m64 m0, m1;
m0 = *(word64*)(input+0);

结果:

1>  error C2679: binary '=' : no operator found which takes a right-hand operand
of type 'word64' (or there is no acceptable conversion)
1>  c:\Program Files (x86)\Microsoft Visual Studio 10.0\VC\include\mmintrin.h(42):
could be '__m64 &__m64::operator =(const __m64 &)'
1>  while trying to match the argument list '(__m64, word64)'

其次,试图回避word64的潜在问题并直接使用unsigned __int64*

m0 = *(unsigned __int64*)(input+0);

结果相同:

1>  blake2.cpp(530): error C2679: binary '=' : no operator found which takes a right-hand
operand of type 'unsigned __int64' (or there is no acceptable conversion)

第三,我浏览了<mmintrin.h>并找到_m_from_int

m0 = _m_from_int(*(word64*)(input+0));

结果是:

1>  blake2.cpp(529): warning C4244: 'argument' : conversion from 'word64'
to 'int', possible loss of data

我不确定此时还有什么可以尝试。

如何从64位整数类型加载__m64

以下是Microsoft的__m64声明,但我们应该将其视为不透明:

typedef union __declspec(intrin_type) _CRT_ALIGN(8) __m64
{
    unsigned __int64    m64_u64;
    float               m64_f32[2];
    __int8              m64_i8[8];
    __int16             m64_i16[4];
    __int32             m64_i32[2];    
    __int64             m64_i64;
    unsigned __int8     m64_u8[8];
    unsigned __int16    m64_u16[4];
    unsigned __int32    m64_u32[2];
} __m64;

1 个答案:

答案 0 :(得分:1)

首先我注意到你的输入是一个字节数组。从字节数组转换为多字节二进制文件(如int64)时,您可能需要考虑字节顺序。出于这个问题的目的,我将忽略这个问题,但如果你得到的东西看起来不对,那么#34;这是值得考虑的事情。

在第一个错误编译器中,编译器在从解除引用的指针转换为word64(unsigned __int64)时遇到问题。我没有准备好访问标题,但我怀疑这可能与“常量”有关。你想要一个复制操作符,但我相信你得到了assign操作符。第二个编译器错误的相同问题(m0 = (无符号__int64 )(输入+ 0);)

您的第三个错误似乎是由_m_to_int引起的,期望签名的int64并获得一个无符号的int64。

我想知道是否有:

const word64 *m0 = ((const word64*)input)[ 0];

const word64 m0 = &((const word64*)input);

可能有用吗?