我正在尝试为Linux创建一个脚本,该脚本将检测文本光标所在的位置。此操作最多应在1秒内完成。为了实现这一点,最好的解决方案似乎是通过xdotool
以编程方式添加一些文本,通过其他实用程序进行屏幕截图,尝试找出该文本的位置,然后删除我们已经再次使用xdotool
插入。
我尝试插入随机字符串(例如<-- CURSOR HERE
)。使用Tesseract 4,大约需要20秒才能找到字符串的位置,尽管就像素坐标而言非常精确。我无法使用白名单(在Tesseract的版本4中)将结果仅缩小到特定的字母或数字,我认为这会加快处理速度。
我不知道用户将使用哪种字体,但是每种字体都有破折号和斜杠,因此我可以创建某种形状(例如|/\|/\|/\|/\|
),并使用一些库来检测该形状形状。什么是一个好选择?
我不在乎屏幕的其余部分:它可能是更多的文本,图像等。我只需要知道随机字符串在哪里(<-- CURSOR HERE
,|/\|/\|/\|/\|
,或您还能想到其他什么),并获得其X / Y像素位置。