我想检测图像中文本的字体,以便可以对它进行更好的OCR。寻找this帖子中找到的解决方案。尽管它似乎与我的问题相同,但是并不能完全解决我的问题。
背景
对于OCR,我正在使用tesseract,后者使用经过训练的数据来识别文本。用大量字体训练tesseract会降低准确性,这是自然的并且可以理解的。一种解决方案是构建多个训练过的数据(每几种相似的字体一个),然后为每个图像自动使用适当的数据。为此,我们需要能够检测图像中的字体。
第3个数字使用OCR来分离字符的图像及其识别的字符,然后使用每种字体生成相同字符的图像,并将其与分离的图像进行比较。在我的情况下,用户应提供一个边界框及其相关的字符。但是因为我要使用OCR阿拉伯文字(草书,并且字符形状可能会根据与它相邻的其他字符的不同而有所不同)和 ,因为边界框可能实际上不是最小边界框 ,我不确定如何进行比较。
我认为Hausdorff distance在这里不适用。我说的对吗?
shape context可能很好(?),并且opencv中有一个shapeContextDistanceExtractor类,但是我不确定如何在opencv-python中使用它
谢谢你 对不起,英语不好