我想对很大的图像(> 20Mb)执行双线性插值。常规代码需要很长时间。我尝试将其进行多处理,但是在结果中,似乎仅出现最后一列像素。 抱歉,这是一个菜鸟问题。
def GetBilinearPixel(imArr,r,c, posX, posY,enlargedShape):
out=[]
modXi = int(posX)
modYi = int(posY)
modXf = posX - modXi
modYf = posY - modYi
modXiPlusOneLim = min(modXi+1,imArr.shape[1]-1)
modYiPlusOneLim = min(modYi+1,imArr.shape[0]-1)
for chan in range(imArr.shape[2]):
bl = imArr[modYi, modXi, chan]
br = imArr[modYi, modXiPlusOneLim, chan]
tl = imArr[modYiPlusOneLim, modXi, chan]
tr = imArr[modYiPlusOneLim, modXiPlusOneLim, chan]
b = modXf * br + (1. - modXf) * bl
t = modXf * tr + (1. - modXf) * tl
pxf = modYf * t + (1. - modYf) * b
out.append(int(pxf))
enlargedShape[r, c]=out
if __name__ == '__main__':
im = cv.imread('new.jpeg')
#print im.shape
#manager = multiprocessing.Manager()
size=map(int, [im.shape[0]*2, im.shape[1]*2, im.shape[2]])
print size
enlargedShape=sharedmem.full(size, 0, dtype=np.uint8)
#print enlargedShape
#enlargedShape = list(map(int, [im.shape[0]*2, im.shape[1]*2, im.shape[2]]))
rowScale = float(im.shape[0]) / float(enlargedShape.shape[0])
colScale = float(im.shape[1]) / float(enlargedShape.shape[1])
#My Code starts her
jobs = []
for r in range(enlargedShape.shape[0]):
for c in range(enlargedShape.shape[1]):
orir = r * rowScale
oric = c * colScale
#enlargedImg[r, c] = GetBilinearPixel(im, oric, orir)
#My code
p = multiprocessing.Process(target=GetBilinearPixel, args=(im,r,c, oric, orir,enlargedShape))
jobs.append(p)
p.start()
p.join()
print enlargedShape
cv.imshow("cropped",enlargedShape)
cv.waitKey(0)
有没有其他方法可以优化代码?
答案 0 :(得分:0)
如果您真的想解决这个问题,请学习3D图形框架(例如OpenGL或DirectX),然后让GPU来完成。 GPU的纹理映射功能是使用硬件加速插值将图像映射到任何大小,任何形状的图像的功能,该操作几乎立即发生。
此外,您可能还必须使用屏幕外渲染将渲染结果返回到主存储器。来回传输图像可能会花费一些时间,但比在CPU中执行所有操作要快得多。