如何将摄像头图像转换为RGB深度

时间:2019-06-09 16:08:04

标签: machine-learning computer-vision

我正在使用PC的网络摄像头构建类似iPhone的FaceID程序。我关注的是this notebook,它使用Kinect创建RGB-D图像。那么我可以使用网络摄像头来捕获多个图像以达到相同的目的吗?

这是在Kinect图像中预测人物的方法。它使用一个.dat文件。

inp1 = create_input_rgbd(file1)
file1 = ('faceid_train/(2012-05-16)(154211)/011_1_d.dat')
inp2 = create_input_rgbd(file1)

model_final.predict([inp1, inp2])

1 个答案:

答案 0 :(得分:0)

他们使用Kinect来创建RGB-D图像,而您只想使用RGB相机做类似的事情?从硬件上讲,它们是不同的。所以不会有直接方法

您必须首先仅使用单眼图像估算深度图。

那么您可以尝试重新访问单图像深度估计:如下图所示,向具有精确对象边界的高分辨率地图倾斜。获得的深度非常接近真实的地面真相。对于非生命危险的情况(例如控制无人机或控制汽车),您可以随时使用。

enter image description here

代码和模型可在

获得

https://github.com/JunjH/Revisiting_Single_Depth_Estimation

编辑演示py文件以进行单个图像检测。

    image = you
    deep_learned_fake_depth = model(image)
    #Add your additional classification routing behind.

请注意,此方法无法实时运行。因此,您只能在关键帧处执行此操作。通常,人们使用特征跟踪技术来伪造连续检测(这是常见做法)。

还请注意,某些电话设备的确装有一个小的深度估计传感器,您可以使用它。详细信息我不太确定,因为我仅以最低水平处理android和ios。