应用错误收集

如何从pdf / image中检测特殊符号？

时间：2019-02-06 05:57:36

标签： ocr tesseract

http://www.builditsoftware.com/wp-content/uploads/578x551xGDT_TypesCharacteristicsSymbols.png.pagespeed.ic.I-zS47cHfO.png

我想检测上方图像中的符号，我在线尝试了几种文本提取器api，它们正在检测文本，但不能检测上方图像中的特殊符号，我已经在Java eclipse中尝试过tesseract ocr库，结果还是一样。

有人可以建议我如何实现这一目标。

2 个答案:

答案 0 :(得分：1)

您可以使用任何深度学习框架（例如TF，PyTorch甚至pytesseract），使用带有足够标签的输入来开发自己的模型。

在这里阅读：[https://www.learnopencv.com/deep-learning-based-text-recognition-ocr-using-tesseract-and-opencv/]

我很怀疑您是否能找到一个预先训练的模型。

答案 1 :(得分：0)

您可以尝试使用OpenCV进行模板匹配。