如何从pdf / image中检测特殊符号?

时间:2019-02-06 05:57:36

标签: ocr tesseract

http://www.builditsoftware.com/wp-content/uploads/578x551xGDT_TypesCharacteristicsSymbols.png.pagespeed.ic.I-zS47cHfO.png

我想检测上方图像中的符号,我在线尝试了几种文本提取器api,它们正在检测文本,但不能检测上方图像中的特殊符号, 我已经在Java eclipse中尝试过tesseract ocr库,结果还是一样。

有人可以建议我如何实现这一目标。

2 个答案:

答案 0 :(得分:1)

您可以使用任何深度学习框架(例如TF,PyTorch甚至pytesseract),使用带有足够标签的输入来开发自己的模型。

在这里阅读:[https://www.learnopencv.com/deep-learning-based-text-recognition-ocr-using-tesseract-and-opencv/]

我很怀疑您是否能找到一个预先训练的模型。

答案 1 :(得分:0)

您可以尝试使用OpenCV进行模板匹配。