使用Mac OS X 10.7的vecLib框架将矩阵和向量相乘的问题

时间:2011-07-31 02:45:31

标签: macos math blas accelerate-framework

我刚刚开始使用vecLib框架来使程序在Mac OS X 10.7上进行密集的矩阵向量乘法。我做了一个这样简单的程序;将矩阵a与向量x相乘,并将结果加到向量y上。

#include <vecLib/vectorOps.h>
#include <stdio.h>

float a[8][4] =     // the matrix to be multiplied
{
    {1.0f, 0.0f, 0.0f, 0.0f},
    {0.0f, 1.0f, 0.0f, 0.0f},
    {1.0f, 1.0f, 0.0f, 0.0f},
    {0.0f, 0.0f, 1.0f, 1.0f},
    {1.0f, 0.0f, 1.0f, 0.0f},
    {1.0f, 0.0f, 1.0f, 0.0f},
    {1.0f, 1.0f, 1.0f, 0.0f},
    {0.0f, 0.0f, 0.0f, 1.0f},
};

float x[4] = {1.0f, 2.0f, 4.0f, 8.0f};  // the vector to be multiplied
float y[8] = {0.f, 0.f, 0.f, 0.f,       // the result vector
              0.f, 0.f, 0.f, 0.f};


int main() {
    int i;
    vSgemv('n', 8, 4, 1.0f, (const vFloat *)a, (const vFloat *)x, 1.0f, (vFloat *)y);

    for (i = 0; i < 8; i++) {
        printf("%.4f\n", y[i]);
    }

    return 0;
}

我在控制台上编译并运行程序

gcc -framework vecLib -o test test.c && ./test

但结果是这样的;操作没有发生,结果向量仍然是空的。

0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000

我是否缺少一些初始化来在vecLib框架中运行矩阵和向量函数?

1 个答案:

答案 0 :(得分:10)

首先,实际的bug非常简单,但你无法知道;你正在为第一个参数传递'n',但实际上你需要传递'N'(尽管标题中写了什么)。通过该修复,您的代码可以正常运行。

现在,那就是说,你做了一些更微妙的事情“错误”(ish)。

首先,请不要使用vecLib。它被Accelerate.framework(10.4!)取代。 vecLib.framework仅用于遗留支持。任何新的开发都应该与Accelerate相关联。

其次,请不要使用vectorOps.h中定义的v *函数。它们也被替换,使用cblas.h中定义的行业标准BLAS功能。由于它们是标准的,因此有许多关于如何使用它们的公共文档,并且它们也得到了更快的实现支持; vectorOps函数仅为传统支持维护。 cblas.h还支持更多操作和数据类型。如果这还不够,如果您决定将代码移植到iOS,您会发现vectorOps函数根本不可用。使用cblas.h功能。

按建议重新编写示例:

#include <Accelerate/Accelerate.h>
#include <stdio.h>

float a[8][4] =     // the matrix to be multiplied
{
    {1.0f, 0.0f, 0.0f, 0.0f},
    {0.0f, 1.0f, 0.0f, 0.0f},
    {1.0f, 1.0f, 0.0f, 0.0f},
    {0.0f, 0.0f, 1.0f, 1.0f},
    {1.0f, 0.0f, 1.0f, 0.0f},
    {1.0f, 0.0f, 1.0f, 0.0f},
    {1.0f, 1.0f, 1.0f, 0.0f},
    {0.0f, 0.0f, 0.0f, 1.0f},
};

float x[4] = {1.0f, 2.0f, 4.0f, 8.0f};  // the vector to be multiplied
float y[8] = {0.f, 0.f, 0.f, 0.f,       // the result vector
    0.f, 0.f, 0.f, 0.f};


int main() {
    int i;
    cblas_sgemv(CblasRowMajor, CblasNoTrans, 8, 4, 1.0f, (float*)a, 4, x, 1, 1.0f, y, 1);

    for (i = 0; i < 8; i++) {
        printf("%.4f\n", y[i]);
    }

    return 0;
}

并运行它给出:

scanon$ gcc test.c -framework Accelerate -o test
scanon$ ./test
1.0000
2.0000
3.0000
12.0000
5.0000
5.0000
7.0000
8.0000