是否有用于从 png 位图屏幕截图中提取文本的库等?
它适用于自动化器,并且(例如)能够读取按钮等。我已经检查了Tesseract,但它似乎是为图片而不是计算机屏幕字体。
答案 0 :(得分:1)
如果您正在处理少量可能的匹配(即:您想要识别两个或三个不同的按钮),最简单的方法是隔离前一个屏幕截图中的那些,将它们保存到单个文件中,然后使用某种形式的模板匹配,即quite easy in opencv。
但是,如果您需要实际执行按钮文本的识别,则需要一个OCR引擎。如果你能get it trained for your font(这是一个漫长的过程),Tesseract是一个很好的候选人。正如你所提到的,如果你正在处理一个小字体,你将需要来做这件事,而这个字体最初并没有被识别出来。如果你不能,那么在python中可以使用其他一些引擎,比如Ocropus