任何人都可以告诉我什么是一个好的框架或API,允许在图像上进行多个文本检测。理想情况下,我想要图像上的文本位置(坐标)。我一直在寻找一段时间,但无济于事。
谢谢
答案 0 :(得分:0)
这看起来有点棘手,除非你能稍微简化一下这个问题。现在是手写还是打印的文字?它是正面(与图像平面平行)。最简单的方法是使用OCR或字符识别应用程序(如果它与图像平面不平行,则使用透视失真)并创建一个可以进行阈值处理的分数。如果有很多字符,准确度会增加。但它可能在计算上非常强烈,除非你有一个大约“比例”的字符,因为你正在搜索比例,位置和有限的失真,这可能是一个巨大的搜索空间。