我想使用图像处理和ML(主要是Tensorflow)提取自行车仪表盘群集上显示的数据。此类群集的示例是
。
我的输入将是完整的图像,我想从集群中获取诸如速度计显示的速度,空挡指示器状态(开/关),里程表读数等数据。谁能告诉我这样做的完整过程是什么?还是相同的教程在哪里?我是ML新手,网上有很多教程,但我不知道其中哪一个对我有用。
答案 0 :(得分:1)
这里有几件事情要考虑。例如,您首先需要对图像进行一些处理,然后再将其输入到神经网络中。也许裁剪掉包含速度计读数的部分,并在其上执行某种OCR(光学字符识别)以进行速度读取。
实际上,中性指示器要容易一些,因为只有两种状态,您可以自己查看一些样本图像,看看哪些像素实际上会改变颜色并自己进行快速检查,也许像这样
(ON if pixel at (x,y) is green else OFF)
对里程表执行相同的操作,只需确定读数所在的区域,将其裁剪并在较小的图像上执行OCR。因此,如果确实有限制,那么现在您真的只是在寻找使用TensorFlow的OCR教程。
编辑:
您可以使用名为cv2的库在python中以编程方式进行所有裁剪和图像编辑,您可以通过pip进行安装
pip install opencv-python