我如何获取opencv中显示的图像坐标

时间:2019-01-07 22:46:24

标签: python opencv image-processing pygame artificial-intelligence

对不起,标题真的没有意义

我正在尝试使ai单击球使其反弹。 对于上下文,这里是应用程序的图片 enter image description here

在游戏中,当您单击球时,它会上升,然后又下降,游戏的目的是保持它上升。

我已经写了一些代码,使用opencv将图像转换成蒙版,下面是结果的图片

enter image description here

我现在要做的是以像素/坐标为单位找到球的位置,这样我就可以使鼠标移至该位置并单击它。顺便说一句,球在球的左右两侧都有一个边距,因此它不仅会上下左右晃动,而且还会左右移动。球也没有动画,只是运动图像。

我如何以像素/坐标为单位获取球的位置,以便可以将鼠标移至该位置。

这是我的代码的副本:

import numpy as np
from PIL import ImageGrab
import cv2
import time
import pyautogui


def draw_lines(img,lines):
    for line in lines:
        coords = line[0]
        cv2.line(img, (coords[0], coords[1]), (coords[2], coords[3]), [255,255,255], 3)

def process_img(original_image):
    processed_img = cv2.cvtColor(original_image, cv2.COLOR_BGR2GRAY)
    processed_img = cv2.Canny(processed_img, threshold1=200, threshold2=300)
    vertices = np.array([[0,0],[0,800],[850,800],[850,0]
                         ], np.int32)
    processed_img = roi(processed_img, [vertices])

    # more info: http://docs.opencv.org/3.0-beta/doc/py_tutorials/py_imgproc/py_houghlines/py_houghlines.html
    #                          edges       rho   theta   thresh         # min length, max gap:        
    lines = cv2.HoughLinesP(processed_img, 1, np.pi/180, 180,      20,         15)
    draw_lines(processed_img,lines)
    return processed_img

def roi(img, vertices):
    #blank mask:
    mask = np.zeros_like(img)
    # fill the mask
    cv2.fillPoly(mask, vertices, 255)
    # now only show the area that is the mask
    masked = cv2.bitwise_and(img, mask)
    return masked
def main():
    last_time = time.time()
    while(True):
        screen =  np.array(ImageGrab.grab(bbox=(0,40, 800, 850)))
        new_screen = process_img(screen)
        print('Loop took {} seconds'.format(time.time()-last_time))
        last_time = time.time()
        cv2.imshow('window', new_screen)
        #cv2.imshow('window2', cv2.cvtColor(screen, cv2.COLOR_BGR2RGB))
        if cv2.waitKey(25) & 0xFF == ord('q'):
            cv2.destroyAllWindows()
            break

def mouse_movement():
    ##Set to move relative to where ball is
    pyautogui.moveTo(300,400)
    pyautogui.click();
main()

对不起,如果这令人困惑,但是brain.exe已停止工作:( 谢谢

2 个答案:

答案 0 :(得分:3)

您可以这样做:

1。 从屏幕截图中裁剪球的图像,等等。喜欢

img = cv2.imread("screenshot.jpg")
crop_img = img[y:y+h, x:x+w] # you will have to look for the parameters by trial and error

2。  使用template matching来查看球在图像中的位置

3。  在生成的矩形的中间获取点并将鼠标移到那里

我希望这对您有帮助,如果您需要更多有关如何实现以上任何目的的帮助,请随时询问

答案 1 :(得分:1)

当您删除其他相关问题时,我正在研究您的问题,发现您在定位球时遇到性能问题。由于您的球似乎位于一个漂亮的简单白色背景上(除了得分和右上角的close按钮之外),因此可以更轻松/更快地找到球。

首先,在灰度下工作,以便您只有1个通道,而不是3个RGB通道要处理-通常更快。

然后,用白色像素覆盖右上角的乐谱和菜单,以便图像中唯一剩下的就是球。现在反转图像,使所有白色变成黑色,然后您可以使用findNonZero()查找不属于背景的任何东西,即球。

现在找到y方向上的最低和最高坐标,并将它们平均到球的中心,同样地,在x方向上也取另一方向。

#!/usr/bin/env python3

# Load image - work in greyscale as 1/3 as many pixels
im = cv2.imread('ball.png',cv2.IMREAD_GRAYSCALE)

# Overwrite "Current Best" with white - these numbers will vary depending on what you capture
im[134:400,447:714] = 255

# Overwrite menu and "Close" button at top-right with white - these numbers will vary depending on what you capture
im[3:107,1494:1726] = 255

# Negate image so whites become black
im=255-im

# Find anything not black, i.e. the ball
nz = cv2.findNonZero(im)

# Find top, bottom, left and right edge of ball
a = nz[:,0,0].min()
b = nz[:,0,0].max()
c = nz[:,0,1].min()
d = nz[:,0,1].max()
print('a:{}, b:{}, c:{}, d:{}'.format(a,b,c,d))

# Average top and bottom edges, left and right edges, to give centre
c0 = (a+b)/2
c1 = (c+d)/2
print('Ball centre: {},{}'.format(c0,c1))

给出:

a:442, b:688, c:1063, d:1304
Ball centre: 565.0,1183.5

如果我在节目中画了一个红色框,则:

enter image description here

在我的Mac上,处理过程需要845微秒,或者不到一毫秒,相当于每秒1,183帧。显然,您有时间抓屏,但我无法控制。

请注意,您还可以在每个方向上将图像缩小4倍(或8倍或16倍),但仍要确保找到球,这可能会使其更快。

关键字:球,跟踪,跟踪,定位,查找,图像位置,图像,图像处理,python,OpenCV,numpy,边界框,bbox。