使用Pykinect访问Kinect深度数据

时间:2015-04-15 16:24:25

标签: python kinect pykinect

我目前正在开发一个项目,我需要使用PyKinect库访问和处理深度数据。

我想要做的是定义一个深度阈值,我会做一些图像分割,但由于我是PyKinect的新手,我仍然不太清楚在哪里寻找资源,我不知道知道如何访问该数据并获取值。

我也试过使用freenect库,但是我无法让它工作。

有谁可以告诉我该怎么做或将我重定向到某种文档?

1 个答案:

答案 0 :(得分:4)

我刚刚创建了一个snippet on my BitBucket account来使用PyKinect和Pygame可视化深度图像。这是代码:

import thread
import pygame
from pykinect import nui

DEPTH_WINSIZE = 320,240

screen_lock = thread.allocate()
screen = None

tmp_s = pygame.Surface(DEPTH_WINSIZE, 0, 16)


def depth_frame_ready(frame):
    with screen_lock:
        frame.image.copy_bits(tmp_s._pixels_address)
        arr2d = (pygame.surfarray.pixels2d(tmp_s) >> 7) & 255
        pygame.surfarray.blit_array(screen, arr2d)

        pygame.display.update()


def main():
    """Initialize and run the game."""
    pygame.init()

    # Initialize PyGame
    global screen
    screen = pygame.display.set_mode(DEPTH_WINSIZE, 0, 8)
    screen.set_palette(tuple([(i, i, i) for i in range(256)]))
    pygame.display.set_caption('PyKinect Depth Map Example')

    with nui.Runtime() as kinect:
        kinect.depth_frame_ready += depth_frame_ready   
        kinect.depth_stream.open(nui.ImageStreamType.Depth, 2, nui.ImageResolution.Resolution320x240, nui.ImageType.Depth)

        # Main game loop
        while True:
            event = pygame.event.wait()

            if event.type == pygame.QUIT:
                break

if __name__ == '__main__':
    main()

编辑:上面的代码显示了如何将深度数据转换为8位表示(以便可以轻松地将它们绘制为灰度图像)。但是如果你想使用实际的深度数据,你需要知道它们的结构。

使用Microsoft Kinect SDK(PyKinect所基于的),单个深度像素由16位组成。 3个不太有意义的代表玩家指数,而我还没有很好地理解最有意义的那个......但是,让我们说我们需要删除最后3位和第一位。例如,这是您需要为每个像素执行的示例(取自this question):

0 1 1 0 0 0 1 0 0 0 1 1 1 0 0 0 - 16 bits number
0 1 1 0 0 0 1 0 0 0 1 1 1       - 13 bits number
  1 1 0 0 0 1 0 0 0 1 1 1       - 12 bits number

上述操作(删除最后3位和第1位)可以通过arr2d数组上的两个按位运算来实现。因为它是NumPy数组,所以您可以按以下步骤操作:

def depth_frame_ready(frame):
    frame.image.copy_bits(tmp_s._pixels_address)

    arr2d = (pygame.surfarray.pixels2d(tmp_s) >> 3) & 4095
    # arr2d[x,y] is the actual depth measured in mm at (x,y)

然后,您可能需要显示此数据,因此您可能需要一个8位表示。得到它:

arr2d >>= 4