我正在尝试更多地了解SSE / SSE2是如何工作的:我知道SSE / SSE2使用mmx寄存器,大小为128位(16字节),通常这些寄存器有4个浮点单元,我可以存储我的通过包装漂浮。在得到结果之前,我应该“打开它们”。
我的问题是:因为我是菜鸟,为什么要将这些值打包到xmm寄存器中,为什么要解压它们呢?这有什么好处?
答案 0 :(得分:6)
您无需打包/打开包装。如果数字格式正确,则只需使用合适的移动指令将它们加载到寄存器或内存操作数中,以便将内存内容用作add,substract等的第二个操作数。
有时候会发生的事情是,数据并没有从计算的最佳位置到达需要去的地方,这就是各种打包和解压缩指令派上用场的地方。
比如说你正在做这个
的3D图形数学struct coord { float X, Y, Z, W; };
但为了使计算有效,我们一次加载其中四个结构,一个寄存器中的所有四个都加X
,另一个寄存器中的所有四个加Y
等等。现在,之后例如,我们将所有X
,Y
,Z
和W
值[一次四个]与变换矩阵相乘以缩放/旋转对象,我们需要再次将其存储为X,Y,Z和W,这是通过将相应的元素“解包”回相应的X
,Y
,Z
,{{1个别条目。
当然,如果您没有拥有W
值数组,而是存储了四个coord
,X
,Y
和Z
值数组,我们可以将新值存储到数组中各自的插槽中,而无需打包/解包值。
答案 1 :(得分:0)
因为这些寄存器是SSE指令的输入/输出。