基于自动视觉的骑车人检测Android应用程序

时间:2012-10-20 13:10:12

标签: android ocr

上周我选择了我的主要项目。它是一个基于视觉的系统,用于监控通过课程中某些点的计时赛事件中的自行车手。它应该检测骑车者背部的亮黄色比赛号并从中提取数字,并记录时间。 我做了一些关于它的研究,我决定使用Robert Theis的Tesseract Android Tools,叫做Tess Two。为了加快识别文本的过程,我想使用这样一个事实,即从骑车者背上的亮(黄色)矩形中提取数字,并将实际的OCR仅集中在它上面。我没有找到任何代码或任何想法如何检测具有特定颜色的几何图形。感谢您的任何帮助。对不起,如果我犯了任何错误,我在这个网站上很新。

1 个答案:

答案 0 :(得分:1)

图像来自哪里?我问,因为我被要求为类似的应用程序设计提供一些技术帮助(我们正在使用足球运动员的衬衫),我可以告诉你,你会遇到一些问题:

  • 使用高质量的视频输入,而不是依赖于几个数码相机图像。 由于骑手的移动,这个数字几乎肯定是“弯曲的”或扭曲的,并且能够使用一系列图像有时会让你根据一系列“错误读取”计算出它真正的数字
  • 训练您正在使用的字体,但也应用尽可能多的逻辑(如果数字总是两位数,从不以'9'开头,请使用此信息来帮助您获得正确的数字
  • 如果你有能够定位相机的奢侈品(我们没有!),我会认为你的理想位置会在骑手上方并略微向前看,所以你可以用最小的扭曲来捕捉他们的背部
  • 我们发现将视频中的几个静止帧合并为一个图像为我们提供了最佳的整体图像 - 然而,用于此的技术是由第三方开发的,他们不想发布它,我害怕:(
祝你好运!