如何突出显示Camera视图拍摄的图像上的一大块文本

时间:2011-12-28 08:56:31

标签: ios ios4 ocr quartz-graphics

我正在开发一个OCR项目。我的第一个任务是从iPhone相机拍摄图像,然后在图像上找到特定的单词。

下面是我的设备拍摄的示例图像,现在我想找到“STATIONERY”字样的位置,并在图像上用黄色矩形突出显示。

我该怎么做?我是否需要首先使用OCR SDK(如ABBYY),否则我可以这样做吗?

screenshot of image taken by camera

1 个答案:

答案 0 :(得分:3)

如果您需要获取特定单词的坐标,当然您需要先执行OCR。请记住,由于它的底部部分,您可能会因为附加的那个小图像而遇到一些困难。 OCR将在一个类似的背景下做得很好。

关于OCR SDK - 试试ABBYY Cloud OCR SDK,它是ABBYY最近推出的基于云的OCR SDK。它处于测试阶段,所以现在它完全免费使用,并且有一个随时可用的iOS code samples

它有一个xml格式的内置坐标提取功能,我已经裁剪了图像的底部部分,背景很简单并将其发送到SDK,这是我得到的响应:

<charParams l="35" t="39" r="73" b="83" charConfidence="100">S</charParams>
<charParams l="77" t="39" r="117" b="83" charConfidence="100">T</charParams>
<charParams l="120" t="40" r="164" b="83" charConfidence="100">A</charParams>
<charParams l="165" t="40" r="204" b="83" charConfidence="100">T</charParams>
<charParams l="211" t="40" r="225" b="83" charConfidence="100">I</charParams>
<charParams l="231" t="40" r="276" b="84" charConfidence="100">O</charParams>
<charParams l="285" t="41" r="325" b="84" charConfidence="100">N</charParams>
<charParams l="334" t="42" r="370" b="84" charConfidence="100">E</charParams>
<charParams l="377" t="42" r="419" b="85" charConfidence="100">R</charParams>
<charParams l="428" t="42" r="469" b="84" charConfidence="100">Y</charParams>

那些“l”,“t”,“r”,“b”参数代表左,上,右和下,它们描述了每个角色的左上角和右下角的矩形。我相信你正在寻找的东西。