我有一个浮点指针(数组),代表一个图像。 它的元素数量和索引的宽度*高度。 图像不像矩阵,它的原点在左上角。 相反,它的原点位于左下方,就像在carthesian坐标系中一样。 达到最大宽度后,它会从左侧的下一行开始。
所以我想有效地将这个数组转换为2D矩阵(可选:opencv)。
如何以良好有效的方式做到这一点? 我该如何将其转换回来?
提前致谢。
答案 0 :(得分:3)
我会在湖中扔一块石头,看着涟漪。注意:我有没有想法调用者对xformed数据的期望,主要是由于我对OpenCV的初步了解。然而,转型的核心问题似乎很简单。如果我离开基地,请留下评论,我会放弃答案。我提出了两种方法,一种是就地数据反转,另一种是使用C ++类进行简单访问器包装。
就地反转:如果调用者需要反转行以适应传递给API的用法,则可以在适当的位置完成。一旦您使用倒置数据完成,请确保再次执行此操作。纯粹面向字节的一个例子是:
// in-place inversion of the linear matrix to re-origin.
void mat_invert(float *data, size_t height, size_t width)
{
// must be at least 2 rows high for this to mean anything.
if (height < 2)
return;
// setup a pair of pointers to walk the rows in byte-form
unsigned char* top = (unsigned char*)data;
unsigned char *bottom = (unsigned char *)(data + (height-1)*width);
size_t row_width = sizeof(data[0]) * width;
while (top < bottom)
{
for (size_t i=0; i<row_width; i++)
{
*top ^= *bottom;
*bottom ^= *top;
*top++ ^= *bottom++;
}
bottom -= 2*row_width;
}
}
示例用法:
int main(int argc, char *argv[])
{
const size_t w = 10;
const size_t h = 5;
float ar[h*w];
memset(ar, 0, sizeof(ar));
ar[0] = 0.1;
ar[1*w + 1] = 1.1;
ar[2*w + 2] = 2.1;
ar[3*w + 3] = 3.1;
ar[4*w + 4] = 4.1;
// dump original
for (size_t i=0; i<h; i++)
{
for (size_t j=0; j<w; j++)
cout << ar[i*w+j] << ' ';
cout << endl;
}
cout << endl;
// invert original
mat_invert(ar, h, w);
for (size_t i=0; i<h; i++)
{
for (size_t j=0; j<w; j++)
cout << ar[i*w+j] << ' ';
cout << endl;
}
cout << endl;
// invert again
mat_invert(ar, h, w);
for (size_t i=0; i<h; i++)
{
for (size_t j=0; j<w; j++)
cout << ar[i*w+j] << ' ';
cout << endl;
}
cout << endl;
return EXIT_SUCCESS;
}
结果:
0.1 0 0 0 0 0 0 0 0 0
0 1.1 0 0 0 0 0 0 0 0
0 0 2.1 0 0 0 0 0 0 0
0 0 0 3.1 0 0 0 0 0 0
0 0 0 0 4.1 0 0 0 0 0
0 0 0 0 4.1 0 0 0 0 0
0 0 0 3.1 0 0 0 0 0 0
0 0 2.1 0 0 0 0 0 0 0
0 1.1 0 0 0 0 0 0 0 0
0.1 0 0 0 0 0 0 0 0 0
0.1 0 0 0 0 0 0 0 0 0
0 1.1 0 0 0 0 0 0 0 0
0 0 2.1 0 0 0 0 0 0 0
0 0 0 3.1 0 0 0 0 0 0
0 0 0 0 4.1 0 0 0 0 0
隐式访问类:如果你需要的只是为你完成的虚拟行/高度数学运算,以下就足够了:
#include <iostream>
#include <exception>
#include <stdexcept>
using namespace std;
class matrix_xform
{
private:
size_t width, height;
float *data;
public:
matrix_xform(float *data, size_t height, size_t width)
: data(data), width(width), height(height)
{
}
float * operator[](size_t x)
{
if (x > (height-1))
throw std::out_of_range("matrix_xform[x]");
return data + (width * (height - 1 - x));
}
const float * operator[](size_t x) const
{
if (x > (height-1))
throw std::out_of_range("matrix_xform[x]");
return data + (width * (height - 1 - x));
}
};
示例用法:
int main(int argc, char *argv[])
{
const size_t w = 10;
const size_t h = 5;
float ar[h*w];
memset(ar, 0, sizeof(ar));
matrix_xform mat(ar, h, w);
mat[0][0] = 1.0;
mat[1][1] = 1.0;
mat[2][2] = 1.0;
mat[3][3] = 1.0;
mat[4][4] = 1.0;
// dump original
for (size_t i=0; i<h; i++)
{
for (size_t j=0; j<w; j++)
cout << ar[i*w+j] << ' ';
cout << endl;
}
cout << endl;
// dump using accessor
for (size_t i=0; i<h; i++)
{
for (size_t j=0; j<w; j++)
cout << mat[i][j] << ' ';
cout << endl;
}
return EXIT_SUCCESS;
}
结果:
0 0 0 0 1 0 0 0 0 0
0 0 0 1 0 0 0 0 0 0
0 0 1 0 0 0 0 0 0 0
0 1 0 0 0 0 0 0 0 0
1 0 0 0 0 0 0 0 0 0
1 0 0 0 0 0 0 0 0 0
0 1 0 0 0 0 0 0 0 0
0 0 1 0 0 0 0 0 0 0
0 0 0 1 0 0 0 0 0 0
0 0 0 0 1 0 0 0 0 0
我希望涵盖OP正在寻找的每个基地。
答案 1 :(得分:1)
据我了解您的问题,您希望将数组传递给OpenCV API,以便将其解释为(top,left)
索引的二维矩阵。下面的示例说明了一种简单的方法,无需重新排列任何数组:
float a[8] = {1,2,3,4,5,6,7,8}; //your array containing the image
int img_width = 2;
int img_height = 4;
float** b = new float*[img_height];
for(int i=img_height ; i>0; i--)
b[img_height-i] = a+ (i-1)*img_width;
//call your API
do_something(b,img_height,img_width);
//your OpenCV API that expects a 2-d matrix
void do_something(float** x , int r, int c){};
如果需要,可以将其转换为便捷函数/宏,在调用OpenCV API之前,可以调用该函数以获得所需格式的二维矩阵。此外,一旦完成,不要忘记为为此目的创建的临时数组取消分配内存。
答案 2 :(得分:0)
将图像处理API规划为
void my_func (int *src, int *dst, int x_stride, int y_stride, int N);
使得在连续记忆中进行迭代变得容易,同时在向左 - 向右之间翻转扫描方向,但也在向上 - 向下翻转之间。
如果API是针对不同的输入而设计的。输出步幅,还可以改变每个图像元素的字节数(例如,从RGBA到RGB或从24位RGB到16位R5G6B5,从int到float等颜色模式改变)还有图像宽度(和高度......)。
重点是,无论图像的每一行的位置如何,数学都应该是相同的。
其中一项功能可以是:
copy_row(int *src, int* dst, int N, int x_stride);
copy_2D_mem(int *src_base, int* dst_base, int N, int M, int y_stride, int x_stride);
然后,很多现有的opencv算法很可能不关心图像的方向。写自己的,可以使用相同的方法。