我有一些数据,其中缺少一些值
yqt yqu yul yvr ywg yxe yxj yxs yxt yxu yxx yyc yyg yyj yyt yyz yzf
1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0
2 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0
3 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
4 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0
5 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
6 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
7 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0
8 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0
9 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0
10 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0
当我绘制它时,我缺少这些NAN(这是预期的)
y = np.array([np.NAN, 45, 23, np.NAN, 5, 14, 22, np.NAN, np.NAN, 18, 23])
我想要的是连接缺失段的虚线。例如,如果缺少3的数据点,则应该有一条连接2和4之间现有点的虚线(对于缺少的数据点7和8也是如此。如果数据点位于间隔的边缘(数据点0)I想要有一条水平线连接它们(想象上一个/下一个数据点与可用边缘相同)。
我saw这里提出的问题是如何删除这些空段(不是我想要的)。我可以通过创建另一个数组来解决它,这个数组将插入缺失值,所有其他值为NAN,但它看起来很复杂。
因为这看起来像是一种常见的情况,我希望有一种更简单的方法。
答案 0 :(得分:4)
我想说可以直接在这里直接应用链接问题的解决方案,在直线后面画一条虚线。
import numpy as np
import matplotlib.pyplot as plt
y = np.array([np.NAN, 45, 23, np.NAN, 5, 14, 22, np.NAN, np.NAN, 18, 23])
x = np.arange(0, len(y))
mask = np.isfinite(y)
fig, ax = plt.subplots()
line, = ax.plot(x[mask],y[mask], ls="--",lw=1)
ax.plot(x,y, color=line.get_color(), lw=1.5)
plt.show()
要考虑边缘值的水平线,可以检查它们是否为nan并用相邻值替换它们。
import numpy as np
import matplotlib.pyplot as plt
y = np.array([np.NAN, 45, 23, np.NAN, 5, 14, 22, np.NAN, np.NAN, 18, 23,np.NAN])
x = np.arange(0, len(y))
yp = np.copy(y)
if ~np.isfinite(y[0]): yp[0] = yp[1]
if ~np.isfinite(y[-1]): yp[-1] = yp[-2]
mask = np.isfinite(yp)
fig, ax = plt.subplots()
line, = ax.plot(x[mask],yp[mask], ls="--",lw=1)
ax.plot(x,y, color=line.get_color(), lw=1.5)
plt.show()
答案 1 :(得分:3)
您正在寻找的效果的快速简便方法是将相同的系列绘制两次,如下所示:
y = np.array([np.NAN, 45, 23, np.NAN, 5, 14, 22, np.NAN, np.NAN, 18, 23])
x = np.arange(len(y))
_y = y[~np.isnan(y)]
_x = x[~np.isnan(y)]
fig, ax = plt.subplots()
ax.plot(_x, _y, linestyle="--", lw=.5)
ax.plot(x, y, lw=1)
请注意,首先绘制连接缺失值的线,然后将非缺失值绘制为覆盖图(您还可以在调用绘图中使用zorder
kwarg来控制绘图顺序)。上面的代码创建了这个:
答案 2 :(得分:0)
这是一种在边缘上使用多个NaN的解决方案。为了说明这一点,我在每一侧添加了一个NaN。
import numpy as np
import matplotlib.pyplot as plt
y = np.array([np.NAN, np.NAN, 45, 23, np.NAN, 5, 14, 22, np.NAN, np.NAN, 18, 23, np.NAN])
x = np.arange(0, len(y))
mask = np.isfinite(y)
# get first value in list
for i in range(len(mask)):
if mask[i]:
first = i
break
# get last vaue in list
for i in range(len(mask)-1, -1, -1):
if mask[i]:
last = i
break
# fill NaN with near known value on the edges
yp = np.copy(y)
yp[:first] = yp[first]
yp[last + 1:] = yp[last]
mask = np.isfinite(yp)
fig, ax = plt.subplots()
line, = ax.plot(x[mask],yp[mask], ls="--",lw=1)
ax.plot(x,y, color=line.get_color(), lw=1.5)
plt.show()
您可以使用numpy.where
来减少代码量,但是在这里,简单的python迭代实际上更有效。请参见比较in my comment here。
ind = np.where(y)[0]
first, last = ind[0], ind[-1]