应用错误收集

在Tess-Two上获取单词列表

时间：2013-05-16 00:23:13

标签： android tesseract

我正在开发一款在Android上使用OCR的应用。 tess-two样本工作得非常好，我可以获得完整的OCR文本，但我想知道如何在Tesseract实际输出的框内获得单个单词。我可以使用getWords（）。getBoxRects（）来获取边界框的列表，似乎getWords（）函数做了我想要的但它返回了一个Pixa对象，我不知道如何一个单词列表（无论如何）将从中获得单词内的单词。

我正在寻找的输出是一个带有以下键值的地图：

Word：边界框

任何提示都会很棒。

1 个答案:

答案 0 :(得分：1)

您可以解析hOCR输出以获取单词及其坐标。请参阅Export HOCR output for tesseract OCR in android。

如果ResultIterator支持，则使用tess-two API。

在Tess-Two上获取单词列表
在Android Studio项目中导入tess-two和eyes-two
在tess-two和eye-two中的libs文件夹是空的
无法初始化tess-two（无法初始化Tesseract API错误）
在Android上使用Tesseract tess-two分词
tess4j和tess-two之间的差异非常大
最佳Tess-two配置以获得最佳识别结果？
即使拥有正确的权限，tess-two也不会初始化
我正在使用tess-two进行图像到文本转换
OCR android tess-2

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？