应用错误收集

我想检测图像中文本的字体，以便可以对它进行更好的OCR。寻找this帖子中找到的解决方案。尽管它似乎与我的问题相同，但是并不能完全解决我的问题。

背景

对于OCR，我正在使用tesseract，后者使用经过训练的数据来识别文本。用大量字体训练tesseract会降低准确性，这是自然的并且可以理解的。一种解决方案是构建多个训练过的数据（每几种相似的字体一个），然后为每个图像自动使用适当的数据。为此，我们需要能够检测图像中的字体。

this answer中的

第3个数字使用OCR来分离字符的图像及其识别的字符，然后使用每种字体生成相同字符的图像，并将其与分离的图像进行比较。在我的情况下，用户应提供一个边界框及其相关的字符。但是因为我要使用OCR阿拉伯文字（草书，并且字符形状可能会根据与它相邻的其他字符的不同而有所不同）和 ，因为边界框可能实际上不是最小边界框 ，我不确定如何进行比较。

我认为Hausdorff distance在这里不适用。我说的对吗？

shape context可能很好（？），并且opencv中有一个shapeContextDistanceExtractor类，但是我不确定如何在opencv-python中使用它

谢谢你对不起，英语不好

检测图像中文字的字体

0 个答案: