我刚刚开始使用vecLib框架来使程序在Mac OS X 10.7上进行密集的矩阵向量乘法。我做了一个这样简单的程序;将矩阵a与向量x相乘,并将结果加到向量y上。
#include <vecLib/vectorOps.h>
#include <stdio.h>
float a[8][4] = // the matrix to be multiplied
{
{1.0f, 0.0f, 0.0f, 0.0f},
{0.0f, 1.0f, 0.0f, 0.0f},
{1.0f, 1.0f, 0.0f, 0.0f},
{0.0f, 0.0f, 1.0f, 1.0f},
{1.0f, 0.0f, 1.0f, 0.0f},
{1.0f, 0.0f, 1.0f, 0.0f},
{1.0f, 1.0f, 1.0f, 0.0f},
{0.0f, 0.0f, 0.0f, 1.0f},
};
float x[4] = {1.0f, 2.0f, 4.0f, 8.0f}; // the vector to be multiplied
float y[8] = {0.f, 0.f, 0.f, 0.f, // the result vector
0.f, 0.f, 0.f, 0.f};
int main() {
int i;
vSgemv('n', 8, 4, 1.0f, (const vFloat *)a, (const vFloat *)x, 1.0f, (vFloat *)y);
for (i = 0; i < 8; i++) {
printf("%.4f\n", y[i]);
}
return 0;
}
我在控制台上编译并运行程序
gcc -framework vecLib -o test test.c && ./test
但结果是这样的;操作没有发生,结果向量仍然是空的。
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
我是否缺少一些初始化来在vecLib框架中运行矩阵和向量函数?
答案 0 :(得分:10)
首先,实际的bug非常简单,但你无法知道;你正在为第一个参数传递'n'
,但实际上你需要传递'N'
(尽管标题中写了什么)。通过该修复,您的代码可以正常运行。
现在,那就是说,你做了一些更微妙的事情“错误”(ish)。
首先,请不要使用vecLib。它被Accelerate.framework(10.4!)取代。 vecLib.framework仅用于遗留支持。任何新的开发都应该与Accelerate相关联。
其次,请不要使用vectorOps.h
中定义的v *函数。它们也被替换,使用cblas.h
中定义的行业标准BLAS功能。由于它们是标准的,因此有许多关于如何使用它们的公共文档,并且它们也得到了更快的实现支持; vectorOps函数仅为传统支持维护。 cblas.h
还支持更多操作和数据类型。如果这还不够,如果您决定将代码移植到iOS,您会发现vectorOps函数根本不可用。使用cblas.h
功能。
按建议重新编写示例:
#include <Accelerate/Accelerate.h>
#include <stdio.h>
float a[8][4] = // the matrix to be multiplied
{
{1.0f, 0.0f, 0.0f, 0.0f},
{0.0f, 1.0f, 0.0f, 0.0f},
{1.0f, 1.0f, 0.0f, 0.0f},
{0.0f, 0.0f, 1.0f, 1.0f},
{1.0f, 0.0f, 1.0f, 0.0f},
{1.0f, 0.0f, 1.0f, 0.0f},
{1.0f, 1.0f, 1.0f, 0.0f},
{0.0f, 0.0f, 0.0f, 1.0f},
};
float x[4] = {1.0f, 2.0f, 4.0f, 8.0f}; // the vector to be multiplied
float y[8] = {0.f, 0.f, 0.f, 0.f, // the result vector
0.f, 0.f, 0.f, 0.f};
int main() {
int i;
cblas_sgemv(CblasRowMajor, CblasNoTrans, 8, 4, 1.0f, (float*)a, 4, x, 1, 1.0f, y, 1);
for (i = 0; i < 8; i++) {
printf("%.4f\n", y[i]);
}
return 0;
}
并运行它给出:
scanon$ gcc test.c -framework Accelerate -o test
scanon$ ./test
1.0000
2.0000
3.0000
12.0000
5.0000
5.0000
7.0000
8.0000