OpenBLAS如何支持任意大小的向量和矩阵?

时间:2017-03-21 03:16:17

标签: x86 x86-64 blas openblas

我试图理解what it takes to support fast vectorized linear algebra computations for matrices and vectors of arbitrary size。根据我对x86处理器体系结构的理解,它们包含special registers of limited size。这些寄存器允许加载浮点数,并在寄存器中广播操作。你如何有效地绕过有限的尺寸?

我正在查看OpenBLAS源代码来解决这个问题,但是尽管查看了dev docs,但无法找出gemv等简单操作的一般流程。 / p>

1 个答案:

答案 0 :(得分:0)

OpenBLAS依靠内核有效地执行这些操作。在这种情况下,"内核"是专为线性代数运算编写的汇编代码。例如,请参阅x86-64ARM64gemv操作的这些内核。