我正在实施滑动窗口技术来开发照片OCR,即从图片中剪切出特定尺寸的矩形,并检查它是否包含文本。然后矩形再移动一些像素。但是这种滑动窗技术需要花费很多时间。例如,为了处理1366x768的图片,步长为2,窗口大小为20x25,需要6小时。有没有其他技术可以提供帮助或如何加快这一过程?
我在java编码。
答案 0 :(得分:3)
如果不了解您的算法/代码的任何细节,很难给出具体的建议。您可以考虑以下几项潜在的性能改进:
答案 1 :(得分:1)
滑动窗口方法是蛮力的,因此,它们的性质非常慢。也许你应该看看基于显着性的技术,它使用过滤器来优先处理图像的哪些区域。
这是一篇我有点熟悉的论文:B。Draper和A. Lionelle。 “相似变换下的选择性注意评估”,“视觉和图像理解”,100:152-171,2005
最后,您使用的ANN库是什么?确保您的ANN代码正在进行矩阵/向量运算,并且它们尽可能优化!