python / scipy中的多元样条插值?

时间:2011-06-04 17:21:27

标签: python numpy scipy interpolation

是否有库模块或其他直接的方法在python中实现多元样条插值?

具体来说,我在一个规则间隔的三维网格上有一组标量数据,我需要在分散在整个域中的少量点进行插值。对于两个维度,我一直在使用scipy.interpolate.RectBivariateSpline,而我基本上正在寻找三维数据的扩展。

我发现的N维插值例程还不够好:我希望样条曲线优于LinearNDInterpolator以获得平滑度,而且我有太多的数据点(通常超过一百万),例如,径向基函数起作用。

如果有人知道可以执行此操作的python库,或者我可以调用或移植的另一种语言,我真的很感激。

2 个答案:

答案 0 :(得分:43)

如果我正确理解您的问题,您的输入“观察”数据会定期网格化吗?

如果是这样,scipy.ndimage.map_coordinates完全符合您的要求。

第一次通过时有点难以理解,但实质上,你只需要输入一系列坐标,你想要在像素/体素/ n维索引坐标中插入网格的值。

作为2D示例:

import numpy as np
from scipy import ndimage
import matplotlib.pyplot as plt

# Note that the output interpolated coords will be the same dtype as your input
# data.  If we have an array of ints, and we want floating point precision in
# the output interpolated points, we need to cast the array as floats
data = np.arange(40).reshape((8,5)).astype(np.float)

# I'm writing these as row, column pairs for clarity...
coords = np.array([[1.2, 3.5], [6.7, 2.5], [7.9, 3.5], [3.5, 3.5]])
# However, map_coordinates expects the transpose of this
coords = coords.T

# The "mode" kwarg here just controls how the boundaries are treated
# mode='nearest' is _not_ nearest neighbor interpolation, it just uses the
# value of the nearest cell if the point lies outside the grid.  The default is
# to treat the values outside the grid as zero, which can cause some edge
# effects if you're interpolating points near the edge
# The "order" kwarg controls the order of the splines used. The default is 
# cubic splines, order=3
zi = ndimage.map_coordinates(data, coords, order=3, mode='nearest')

row, column = coords
nrows, ncols = data.shape
im = plt.imshow(data, interpolation='nearest', extent=[0, ncols, nrows, 0])
plt.colorbar(im)
plt.scatter(column, row, c=zi, vmin=data.min(), vmax=data.max())
for r, c, z in zip(row, column, zi):
    plt.annotate('%0.3f' % z, (c,r), xytext=(-10,10), textcoords='offset points',
            arrowprops=dict(arrowstyle='->'), ha='right')
plt.show()

enter image description here

要在n维中执行此操作,我们只需要传入适当大小的数组:

import numpy as np
from scipy import ndimage

data = np.arange(3*5*9).reshape((3,5,9)).astype(np.float)
coords = np.array([[1.2, 3.5, 7.8], [0.5, 0.5, 6.8]])
zi = ndimage.map_coordinates(data, coords.T)

就缩放和内存使用情况而言,如果您使用的是订单> map_coordinates将创建数组的过滤副本。 1(即不是线性插值)。如果您只想在极少数点进行插值,这是一个相当大的开销。但是,它不会随着您要插入的数字点而增加。只要有足够的RAM用于输入数据阵列的单个临时副本,你就可以了。

如果您无法将数据副本存储在内存中,则可以a)指定prefilter=Falseorder=1并使用线性插值,或b)使用过滤版本替换原始数据使用ndimage.spline_filter,然后使用prefilter=False调用map_coordinates。

即使你有足够的内存,如果你需要多次调用map_coordinates(例如交互式使用等),保持过滤的数据集可以是一个很大的加速。

答案 1 :(得分:2)

dim中的平滑样条插值> 2很难实现,因此没有多少免费提供的库能够做到这一点(事实上,我不知道)。

您可以尝试反距离加权插值,请参阅:Inverse Distance Weighted (IDW) Interpolation with Python。 这应该产生相当平滑的结果,并且比RBF更好地扩展到更大的数据集。