我正在尝试编写图像处理OpenCL应用程序,但我的问题是任何尝试改变输入图像都会产生看起来像垂直条纹的工件。如果我复制图像像素而不改变它们,则不会发生这种情况。例如,这一行会产生伪影:
pixel = (uint4)(image1_pixel.x,
image1_pixel.y,
image1_pixel.z,
255);
...但是这个按预期工作:
pixel = (uint4)(image1_pixel.x,
image1_pixel.y,
image1_pixel.z,
image1_pixel.w);
Input是不透明的32位PNG图像,因此我希望两个代码行都能产生相同的结果。但实际上,只有第二行按预期工作。第一行给出了output with artifacts。
这是我的内核:
__constant sampler_t sampler = CLK_NORMALIZED_COORDS_FALSE |
CLK_ADDRESS_CLAMP |
CLK_FILTER_NEAREST;
__kernel void test(__read_only image2d_t image1,
__write_only image2d_t out) {
const int2 pos = (int2)(get_global_id(0), get_global_id(1) );
uint4 image1_pixel = read_imageui(image1, sampler, pos);
uint4 pixel = (uint4)(image1_pixel.x,
image1_pixel.y,
image1_pixel.z,
255);
write_imageui(out, pos, pixel);
}
以下是main.cpp代码的相关部分:
CImg<unsigned char> image1("../input.png");
...
Image2D clImage1 = Image2D(context,
CL_MEM_READ_ONLY | CL_MEM_COPY_HOST_PTR,
ImageFormat(CL_RGBA, CL_UNSIGNED_INT8),
image1.width(), image1.height(), 0, image1.data() );
Image2D clResult = Image2D(context, CL_MEM_WRITE_ONLY,
ImageFormat(CL_RGBA, CL_UNSIGNED_INT8),
image1.width(), image1.height(), 0, NULL);
Kernel test = Kernel(program, "test");
test.setArg(0, clImage1); test.setArg(1, clResult);
Event kernel_event, read_event;
queue.enqueueNDRangeKernel(test, NullRange,
NDRange(image1.width(), image1.height() ),
NullRange, NULL, &kernel_event);
cl::size_t<3> origin;
origin.push_back(0); origin.push_back(0); origin.push_back(0);
cl::size_t<3> region;
region.push_back(image1.width() );
region.push_back(image1.height() ); region.push_back(1);
queue.enqueueReadImage(clResult, CL_TRUE,
origin, region, 0, 0,
image1.data(), NULL, NULL);
kernel_event.wait();
image1.save("../output.png");
Here可以下载我的测试应用程序的完整源代码(它包含30行以下的简短main.cpp,CMakeLists.txt,解释如何编译和运行它的readme.txt,输入图像和内核)。我使用CImg库来加载和保存图像。我仔细检查了输入打开为32位RGBA图像。我尝试使用AMD或NVidia SDK运行内核并获得相同的结果。
知道为什么我会得到意想不到的结果吗?
答案 0 :(得分:2)
CImg使用平面格式,OpenCL的image2d_t期望交错 (例如,平面是:R1R2R3R4R5R6 ... G1G2G3G4G5G6 ... B1B2B3B4B5B6 ...,交错的是:R1G1B1R2G2B2R3G3B3 ...) 当您复制像素而不改变它们时,平面格式不会丢失并且它可以工作,但是如果您开始修改图像的一个组件,您将实际修改像素的所有组件,从而修改黑度,因为这个平面/交错问题。
如果您想坚持使用CImg,您可以在将图像发送到设备之前对其进行多路复用:
CImg<unsigned int> muxRGBA(const CImg<unsigned int>& pic)
{
assert( pic.spectrum() == 3 );
CImg<float> mux(pic.width()*4,pic.height(),pic.depth(),1);
cimg_forXYZ(pic,x,y,z){
for(int k=0; k<3; k++) {
mux(x*4+k,y,z,0) = pic(x,y,z,k);
}
mux(x*4+3,y,z,0) = 1.0f; // alpha channel
}
return mux;
}
然后在处理后对其进行解复用,因此您仍然可以使用CImg显示/保存它:
CImg<unsigned int> demuxRGBA(const CImg<unsigned int>& pic)
{
assert( pic.spectrum()==1 );
assert( pic.width()%4 == 0 );
CImg<float> demux(pic.width()/4,pic.height(),pic.depth(),3);
cimg_forXYZ(demux,x,y,z) {
for(int k=0; k<3; k++) {
demux(x,y,z,k) = pic(x*4+k,y,z,0);
}
}
return demux;
}
答案 1 :(得分:0)
内核是正确的,但CImg似乎做了一些非常错误的事情,所以在这种情况下使用它是个坏主意。相反,我使用了Magick ++。它不像CImg那么简单,但它更可靠并且有效。
这是我从文件中读取图像并将其转换为RGBA格式的方式,因此我可以将它与cl :: Image2D一起使用:
Magick::Image image1;
image1.read("input1/0.png");
long image1_size = 4 * image1.rows() * image1.columns();
uint8_t *image1_pixels = new uint8_t[image1_size];
image1.write(0, 0, image1.columns(), image1.rows(),
"RGBA", CharPixel, image1_pixels);
...
Image2D clImage1 = Image2D(context,
CL_MEM_READ_ONLY | CL_MEM_COPY_HOST_PTR,
ImageFormat(CL_RGBA, CL_UNSIGNED_INT8),
image1.columns(), image1.rows(), 0, image1_pixels);
这就是我将结果写入文件的方式:
queue.enqueueReadImage(clResult, CL_TRUE,
origin, region, 0, 0,
image1_pixels, NULL, NULL);
image1.read(image1.columns(), image1.rows(),
"RGBA", CharPixel, image1_pixels);
image1.write("../output.png");
Here可以下载完整的源代码。