我的主要问题在这里解释: translation/rotation through phase correlation in python
具体来说,我想知道如何从相关矩阵中找到峰值,以及如何解释该值。从链接中,对于那些感兴趣的人,详细解释了整个问题,但最重要的是要知道我正在试图找出一个图像相对于另一个图像被翻译和旋转了多远(这是一个稍微修改过的版本另一个图像)。我正在尝试使用相位相关来实现这一点,这给了我一个相关矩阵(类型为numpy数组)作为结果。我尝试在相关矩阵上使用argmax(),这给了我一个数字(215),这对我来说并没有任何意义。我期待两个数字,其中一个应该指示平移的偏移,另一个应该指示一个图像相对于另一个的旋转。
简而言之:如何在相关矩阵中找到峰值(在Python中)?
import scipy as sp
from scipy import ndimage
from PIL import Image
from math import *
import numpy as np
def logpolar(input,silent=False):
# This takes a numpy array and returns it in Log-Polar coordinates.
if not silent: print("Creating log-polar coordinates...")
# Create a cartesian array which will be used to compute log-polar coordinates.
coordinates = sp.mgrid[0:max(input.shape)*2,0:360]
# Compute a normalized logarithmic gradient
log_r = 10**(coordinates[0,:]/(input.shape[0]*2.)*log10(input.shape[1]))
# Create a linear gradient going from 0 to 2*Pi
angle = 2.*pi*(coordinates[1,:]/360.)
# Using scipy's map_coordinates(), we map the input array on the log-polar
# coordinate. Do not forget to center the coordinates!
if not silent: print("Interpolation...")
lpinput = ndimage.interpolation.map_coordinates(input,
(log_r*sp.cos(angle)+input.shape[0]/2.,
log_r*sp.sin(angle)+input.shape[1]/2.),
order=3,mode='constant')
# Returning log-normal...
return lpinput
def load_image( infilename ) :
img = Image.open( infilename )
img.load()
data = np.asarray( img, dtype="int32" )
return data
def save_image( npdata, outfilename ) :
img = Image.fromarray( np.asarray( np.clip(npdata,0,255), dtype="uint8"), "L" )
img.save( outfilename )
image = load_image("C:/images/testing_image1.jpg")[:,:,0]
target = load_image("C:/images/testing_otherimage.jpg")[:,:,0]
# Conversion to log-polar coordinates
lpimage = logpolar(image)
lptarget = logpolar(target)
# Correlation through FFTs
Fcorr = np.fft.fft(lpimage)*np.fft.fft(lptarget)
correlation = np.fft.ifft(Fcorr)
max = np.argmax(correlation)
print max
答案 0 :(得分:1)
此脚本可以满足您的要求:http://www.lfd.uci.edu/~gohlke/code/imreg.py.html。它使用对数极坐标图像结合FFT提供平移,旋转和尺度不变图像共同配准。