我需要测量用OCR / Tesseract检测到的某些字母的高度(以像素为单位)。
我在视频中连续的帧上使用Tesseract,其中出现了给定的单词。然后,我使用tesserocr获取检测到的每个字母的边界框。
问题是,在同一张图像上(同一单词)出现的同一字母的高度有所不同。
可能是什么原因造成的?我该如何预防? -我真的需要像素的确切高度。
非常感谢!
=== 我将tesseract用于高质量的视频中,其中只有一个摄像机角度和清晰的图像。但是,文本的对比度可能会发生变化(例如,文本在某些背景上滚动)。