C#和Kinect v2:获取适合深度像素的RGB值

时间:2018-03-18 19:40:25

标签: c# colors kinect-sdk depth kinect-v2

我用Kinect v2和C#玩了一下,试图得到一个512x424像素大小的图像数组,其中包含深度数据以及相关的颜色信息(RGBA)。

因此,我使用MultiSourceFrameReader课程来接收MultiSourceFrame ColorFrameDepthFrame。使用方法ColorFrame.CopyConvertedFrameDataToArray()DepthFrame.CopyFrameDataToArray(),我收到了包含颜色和深度信息的数组:

// Contains 4*1920*1080 entries of color-info: BGRA|BGRA|BGRA..
byte[] cFrameData = new byte[4 * cWidth * cHeight];
cFrame.CopyConvertedFrameDataToArray(cFrameData, ColorImageFormat.Bgra);

// Has 512*424 entries with depth information
ushort[] dFrameData = new ushort[dWidth* dHeight];
dFrame.CopyFrameDataToArray(dFrameData);

现在,我必须将ColorFrame-data-array cFrameData中的颜色四倍映射到DepthFrame-data-array dFrameData的每个条目,但这就是我所在的位置卡住。输出应该是dFrameData数组大小的4倍(RGBA / BGRA)的数组,并包含深度帧的每个像素的颜色信息:

// Create the array that contains the color information for every depth-pixel
byte[] dColors = new byte[4 * dFrameData.Length];
for (int i = 0, j = 0; i < cFrameData.Length; ++i)
{
    // The mapped color index. ---> I'm stuck here:
    int colIx = ?;

    dColors[j]     = cFrameData[colIx];     // B
    dColors[j + 1] = cFrameData[colIx + 1]; // G
    dColors[j + 2] = cFrameData[colIx + 2]; // R
    dColors[j + 3] = cFrameData[colIx + 3]; // A
    j += 4;
}

有没有人有任何建议?

我还看了一下Kinect-SDK的CoordinateMappingBasics示例,但他们对我已经开始工作的1920x1080像素大小的图像反之亦然。

修改
我认识到我应该能够通过使用包含特定颜色像素的X和Y坐标的ColorSpacePoint - 结构来获取映射的颜色信息。因此,我设置了点...... ..

// Lookup table for color-point information
ColorSpacePoint[] cSpacePoints = new ColorSpacePoint[dWidth * dHeight];    
this.kinectSensor.CoordinateMapper.MapDepthFrameToColorSpace(dFrameData, cSpacePoints);

..并尝试访问颜色信息,如..

int x = (int)(cSpacePoints[i].X + 0.5f);
int y = (int)(cSpacePoints[i].Y + 0.5f);
int ix = x * cWidth + y;
byte r = cFrameData[ix + 2];
byte g = cFrameData[ix + 1];
byte b = cFrameData[ix];
byte a = cFrameData[ix + 3];

..但我仍然得错了颜色。大多是白色的。

1 个答案:

答案 0 :(得分:3)

好吧,我自己想通了。这个错误是微不足道的。由于数组不是像素数组,其中一个条目包含RGBA信息,而是一个字节数组,其中每个条目代表R,G,B或AI必须将索引乘以每像素字节数,在本例中为4所以解决方案看起来像:

int ix = (x * cWidth + y) * 4;
byte r = cFrameData[ix + 2];
byte g = cFrameData[ix + 1];
byte b = cFrameData[ix];
byte a = cFrameData[ix + 3];