我有这个简单的MATLAB代码,它在并行循环中调用imregionalmax
超过256个16X16像素的路径。
function y = Parimregionalmax(x)
assert(isa(x,'uint8'));
assert( all(size(x)==[16 16 256]) );
y = zeros(size(x));
parfor k = 1:size(x,3)
y(:,:,k) = imregionalmax(x(:,:,k));
end
end
将此代码提供给MATLAB的Coder可得到以下C代码:
/*
* Parimregionalmax.c
*
* Code generation for function 'Parimregionalmax'
*
*/
/* Include files */
#include "rt_nonfinite.h"
#include "Parimregionalmax.h"
#include "libmwimregionalmax.h"
/* Function Definitions */
void Parimregionalmax(const unsigned char x[65536], double y[65536])
{
int k;
int i0;
int i1;
double imSize[2];
unsigned char varargin_1[256];
boolean_T conn[9];//unsigned char
double connSize[2];
boolean_T BW[256];
#pragma omp parallel for \
num_threads(omp_get_max_threads()) \
private(i0,i1) \
firstprivate(varargin_1,imSize,conn,connSize,BW)
for (k = 0; k < 256; k++) {
for (i0 = 0; i0 < 16; i0++) {
for (i1 = 0; i1 < 16; i1++) {
varargin_1[i1 + (i0 << 4)] = x[(i1 + (i0 << 4)) + (k << 8)];
}
}
for (i0 = 0; i0 < 2; i0++) {
imSize[i0] = 16.0;
}
for (i0 = 0; i0 < 9; i0++) {
conn[i0] = true;
}
for (i0 = 0; i0 < 2; i0++) {
connSize[i0] = 3.0;
}
imregionalmax_uint8(varargin_1, BW, 2.0, imSize, conn, 2.0, connSize);
for (i0 = 0; i0 < 16; i0++) {
for (i1 = 0; i1 < 16; i1++) {
y[(i1 + (i0 << 4)) + (k << 8)] = BW[i1 + (i0 << 4)];
}
}
}
}
/* End of code generation (Parimregionalmax.c) */
如您所见,生成的代码(运行良好)使用openmp并行化框架并调用函数imregionalmax_uint8
,该函数在单独的“黑匣子” dll(带有相应的头文件和lib文件)中实现。
无论我使用哪种并行化框架,我都可以假定此功能始终是线程安全的吗?
示例:
1。是否可以在控制台中使用C ++ <thread>
库定义两个线程
应用程序(VS中的exe文件),然后从每个线程调用
imregionalmax_uint8
?
答案 0 :(得分:1)
是,不是。
不,因为几乎没有人会为这种事情写出良好的保证。 This is a wonderful podcast about NVidia using C++'s threading model最终使线程系统正式化,但抱怨是在C ++尝试之前,大多数抽象的线程/内存模型都在那儿胡扯。充其量,您会获得关于一组特定硬件的奥秘和特定信息,或者声称您像其他一些(通常是较旧的)硬件一样工作。
除了是,因为实际上,它们所使用的互斥锁和同步的种类将在几乎每个台式机系统上兼容。在移动计算CPU和其他更晦涩的系统上可能更少。