如何强制Android版Mobile Vision阅读全文文本?

时间:2018-06-14 11:07:45

标签: android

我已经按照教程实施了谷歌的Android移动视觉。我正在尝试构建一个应用程序,它将扫描收据并找到数字总数。但是,当我扫描以不同格式打印的不同收据时,API将以似乎任意方式检测TextBlocks。例如,在一个收据中,如果几个文本单词由单个空格分隔,则它们被分组为单个TextBlock。但是,如果两个文本的单词由大量空格分隔,则它们将被分隔为独立的TextBlock,即使它们出现在同一行"行"上。我想要做的是强制API将收据的每一行都识别为单个实体。这可能吗?

1 个答案:

答案 0 :(得分:1)

据我所知:不,您无法以任何方式配置检测和识别。 其原生部分(libocr.so)使用神经网络,该网络经过训练以某种方式查找块(或行和单词)。

如果您仔细查看API,可以执行的操作:任何WordLineBlock都附加了坐标。您将必须检查它们的坐标并确定它们是否被认为是同一条线(考虑到它的图片可能无法正确对齐)。

这可能不会以相同的方式对所有收据起作用,因此您也可以为不同的收据实施不同的搜索启发式。