获取屏幕快照中文本或基于文本的形状的X / Y位置的最快方法?

时间:2018-11-20 11:19:05

标签: linux opencv imagemagick tesseract

我正在尝试为Linux创建一个脚本,该脚本将检测文本光标所在的位置。此操作最多应在1秒内完成。为了实现这一点,最好的解决方案似乎是通过xdotool以编程方式添加一些文本,通过其他实用程序进行屏幕截图,尝试找出该文本的位置,然后删除我们已经再次使用xdotool插入。

我尝试插入随机字符串(例如<-- CURSOR HERE)。使用Tesseract 4,大约需要20秒才能找到字符串的位置,尽管就像素坐标而言非常精确。我无法使用白名单(在Tesseract的版本4中)将结果仅缩小到特定的字母或数字,我认为这会加快处理速度。

我不知道用户将使用哪种字体,但是每种字体都有破折号和斜杠,因此我可以创建某种形状(例如|/\|/\|/\|/\|),并使用一些库来检测该形状形状。什么是一个好选择?

我不在乎屏幕的其余部分:它可能是更多的文本,图像等。我只需要知道随机字符串在哪里(<-- CURSOR HERE|/\|/\|/\|/\|,或您还能想到其他什么),并获得其X / Y像素位置。

0 个答案:

没有答案