应用错误收集

OpenBLAS如何支持任意大小的向量和矩阵？

时间：2017-03-21 03:16:17

标签： x86 x86-64 blas openblas

我试图理解what it takes to support fast vectorized linear algebra computations for matrices and vectors of arbitrary size。根据我对x86处理器体系结构的理解，它们包含special registers of limited size。这些寄存器允许加载浮点数，并在寄存器中广播操作。你如何有效地绕过有限的尺寸？

我正在查看OpenBLAS源代码来解决这个问题，但是尽管查看了dev docs，但无法找出gemv等简单操作的一般流程。 / p>

1 个答案:

答案 0 :(得分：0)

OpenBLAS依靠内核有效地执行这些操作。在这种情况下，＆＃34;内核＆＃34;是专为线性代数运算编写的汇编代码。例如，请参阅x86-64和ARM64的gemv操作的这些内核。