tesseract-ocr输出是否有字符或文件大小限制?

时间:2017-04-06 10:04:10

标签: python-2.7 tesseract raspberry-pi3

我正在使用raspberry pi 3B和python对使用raspberry pi相机捕获的图像进行图像处理。以下是原始图片:https://drive.google.com/open?id=0Bxm5MQBqJ3WvMHB2VmdZdDByaXM

这是旋转和裁剪后的图像,作为tesseract的输入: https://drive.google.com/open?id=0Bxm5MQBqJ3WvVU5hM2t6aFZ5RUE

在运行tesseract-ocr之后,它以合理的准确度识别出大约2/3的图像,但完全没有留下最后一部分。这是由于文件大小限制还是有其他原因?

这是运行tesseract后的文字:

Instmrnentntlun是收集用于测量仪器的术语 说明。测量和记录物理量。

术语检测可以指直接的简单事物 读温度计或。当使用许多传感器时,可以{mvmm 复杂的工业控制系统,如制造1 ry,a"。 。 和运输。可以在househo中找到lnstrutnentation作为w。

烟雾探测器或加热恒温器就是例子。

在某些情况下,传感器是机制的一个非常小的元素。数字 相机和手表可能在技术上符合松散的定义 仪器,因为它们记录和/或显示感测信息。下 大多数情况都不会被称为仪器,但在使用时 衡量一场比赛的经过时间,并在最后一行记录胜利者, 两者都称为仪器。

家用

仪器系统的一个非常简单的例子是

机械恒温器,用于控制家用炉灶,从而控制 室内温度。典型的单元用双金属条感应温度。它 通过条带自由端上的针显示温度。它激活了 炉子由水银开关。当开关通过条带旋转时,水银 使电极之间发生物理接触(从而电接触)。

仪器系统的另一个例子是家庭安全系统。这样 系统由传感器(运动检测,检测门的开关)组成 开口),检测入侵的简单算法,本地控制(布防/撤防)和

远程监控系统,以便警方可以召唤。 沟通是设计的固有部分。

汽车

1 个答案:

答案 0 :(得分:1)

如果有这样的限制,你的形象肯定不在它附近。我认为剩下的文字太过分了。尝试手动纠正剩余的文本 - 并保持图像的其余部分不变。

虽然tesseract甚至可以在更高的倾斜角度下工作,但是每个段落(在你的例子中)偏斜变化的事实可能会使它偏离最后一个。