我有一个复杂的曲线定义为表中的一组点,如此(完整的表格为here):
# x y
1.0577 12.0914
1.0501 11.9946
1.0465 11.9338
...
如果我使用命令绘制此表:
plt.plot(x_data, y_data, c='b',lw=1.)
plt.scatter(x_data, y_data, marker='o', color='k', s=10, lw=0.2)
我得到以下内容:
我手动添加了红点和段。我需要的是为每个点计算这些段的方法,即:一种查找从此2D空间中给定点到插值曲线的最小距离的方法。
我不能使用到数据点本身的距离(产生蓝色曲线的黑点),因为它们不是以相等的间隔定位,有时它们很接近,有时它们相距很远,这会对我的结果产生深远的影响更进一步。
由于这不是一个表现良好的曲线,我不确定我能做些什么。我尝试使用UnivariateSpline进行插值,但它返回的非常差:
# Sort data according to x.
temp_data = zip(x_data, y_data)
temp_data.sort()
# Unpack sorted data.
x_sorted, y_sorted = zip(*temp_data)
# Generate univariate spline.
s = UnivariateSpline(x_sorted, y_sorted, k=5)
xspl = np.linspace(0.8, 1.1, 100)
yspl = s(xspl)
# Plot.
plt.scatter(xspl, yspl, marker='o', color='r', s=10, lw=0.2)
我也试过增加插值点的数量,但弄得一团糟:
# Sort data according to x.
temp_data = zip(x_data, y_data)
temp_data.sort()
# Unpack sorted data.
x_sorted, y_sorted = zip(*temp_data)
t = np.linspace(0, 1, len(x_sorted))
t2 = np.linspace(0, 1, 100)
# One-dimensional linear interpolation.
x2 = np.interp(t2, t, x_sorted)
y2 = np.interp(t2, t, y_sorted)
plt.scatter(x2, y2, marker='o', color='r', s=10, lw=0.2)
任何想法/指示都将不胜感激。
答案 0 :(得分:18)
如果您愿意使用图书馆,请查看shapely
:https://github.com/Toblerity/Shapely
作为一个简单示例(points.txt
包含您在问题中链接的数据):
import shapely.geometry as geom
import numpy as np
coords = np.loadtxt('points.txt')
line = geom.LineString(coords)
point = geom.Point(0.8, 10.5)
# Note that "line.distance(point)" would be identical
print point.distance(line)
作为一个交互式示例(这也绘制了您想要的线段):
import numpy as np
import shapely.geometry as geom
import matplotlib.pyplot as plt
class NearestPoint(object):
def __init__(self, line, ax):
self.line = line
self.ax = ax
ax.figure.canvas.mpl_connect('button_press_event', self)
def __call__(self, event):
x, y = event.xdata, event.ydata
point = geom.Point(x, y)
distance = self.line.distance(point)
self.draw_segment(point)
print 'Distance to line:', distance
def draw_segment(self, point):
point_on_line = line.interpolate(line.project(point))
self.ax.plot([point.x, point_on_line.x], [point.y, point_on_line.y],
color='red', marker='o', scalex=False, scaley=False)
fig.canvas.draw()
if __name__ == '__main__':
coords = np.loadtxt('points.txt')
line = geom.LineString(coords)
fig, ax = plt.subplots()
ax.plot(*coords.T)
ax.axis('equal')
NearestPoint(line, ax)
plt.show()
请注意,我添加了ax.axis('equal')
。 shapely
在数据所在的坐标系中运行。如果没有等轴图,视图将会失真,而shapely
仍会找到最近的点,它看起来不会很正确显示:
答案 1 :(得分:5)
曲线本质上是参数化的,即对于每个x,不需要唯一的y,反之亦然。所以你不应该插入y(x)或x(y)形式的函数。相反,你应该做两个插值,x(t)和y(t),其中t是相应点的索引。
然后使用scipy.optimize.fminbound
找到最优t,使得(x(t) - x0)^ 2 +(y(t) - y0)^ 2最小,其中(x0,y0)是第一个数字中的红点。对于fminsearch,您可以指定t的最小/最大界限为1
和len(x_data)
答案 2 :(得分:1)
您可以尝试在曲线上的增量点对上实现点到线距离的计算并找到最小值。这将从绘制的曲线中引入一点误差,但它应该非常小,因为这些点相对较近。
http://en.wikipedia.org/wiki/Distance_from_a_point_to_a_line
答案 3 :(得分:0)
您可以轻松地在 PyPI 中使用包 trjtrypy:https://pypi.org/project/trjtrypy/
此包中提供了所有需要的计算和可视化。您可以在如下一行代码中得到答案:
获取最小距离使用:trjtrypy.basedists.distance(points, curve)
可视化曲线和点使用:trjtrypy.visualizations.draw_landmarks_trajectory(points, curve)