英特尔至强融核的每个时钟周期的乘法次数

时间:2013-10-09 22:47:53

标签: intel intel-mic xeon-phi

在Intel Xeon Phi中,每个内核有32个512位宽的向量寄存器。每个向量寄存器每个周期可以进行16个单精度浮点运算。并且可以在1个循环中完成2个操作(v管中为1个,u管中为1个)。

我想知道除了向量寄存器中的向量乘法之外,在1个时钟周期内可以进行多少标量乘法。

1 个答案:

答案 0 :(得分:1)

那里存在一些误解。每个核心有1个向量单位。寄存器存储值,它们不计算。因此,每个核心每个周期可以发出1 512字节宽的向量运算。您也可以在1个周期内进行标量乘法运算。您不能同时发布这两个。使用u& v管道,您可以发出一个向量或标量操作,然后在另一个管道中执行内存操作。您可以在每个周期执行融合乘法 - 加法(MADD)指令,这有效地为每个核每个周期提供2个向量运算。