包装和拆包SSE / SSE2指令的数据?

时间:2013-01-30 18:06:39

标签: c++ sse2 sse

我正在尝试更多地了解SSE / SSE2是如何工作的:我知道SSE / SSE2使用mmx寄存器,大小为128位(16字节),通常这些寄存器有4个浮点单元,我可以存储我的通过包装漂浮。在得到结果之前,我应该“打开它们”。

我的问题是:因为我是菜鸟,为什么要将这些值打包到xmm寄存器中,为什么要解压它们呢?这有什么好处?

2 个答案:

答案 0 :(得分:6)

您无需打包/打开包装。如果数字格式正确,则只需使用合适的移动指令将它们加载到寄存器或内存操作数中,以便将内存内容用作add,substract等的第二个操作数。

有时候会发生的事情是,数据并没有从计算的最佳位置到达需要去的地方,这就是各种打包和解压缩指令派上用场的地方。

比如说你正在做这个

的3D图形数学
struct coord { float X, Y, Z, W; };

但为了使计算有效,我们一次加载其中四个结构,一个寄存器中的所有四个都加X,另一个寄存器中的所有四个加Y等等。现在,之后例如,我们将所有XYZW值[一次四个]与变换矩阵相乘以缩放/旋转对象,我们需要再次将其存储为X,Y,Z和W,这是通过将相应的元素“解包”回相应的XYZ,{{1个别条目。

当然,如果您没有拥有W值数组,而是存储了四个coordXYZ值数组,我们可以将新值存储到数组中各自的插槽中,而无需打包/解包值。

答案 1 :(得分:0)

因为这些寄存器是SSE指令的输入/输出。