我想使用pylab绘制散点图,但是,我的一些数据是NaN
,如下所示:
a = [1, 2, 3]
b = [1, 2, None]
pylab.scatter(a,b)
不起作用。
是否有某些方法可以在不显示这些NaN
值的情况下绘制真实价值点?
答案 0 :(得分:14)
如果您使用NaN
,事情会完美无缺。 None
不是一回事。 NaN
是一个浮动。
举个例子:
import numpy as np
import matplotlib.pyplot as plt
plt.scatter([1, 2, 3], [1, 2, np.nan])
plt.show()
如果要处理丢失的数据,请查看pandas
或numpy蒙面数组(以及numpy.genfromtxt
来加载数据)。蒙面数组内置于numpy中,但pandas
是一个非常有用的库,并且具有非常好的缺失值功能。
举个例子:
import matplotlib.pyplot as plt
import pandas
x = pandas.Series([1, 2, 3])
y = pandas.Series([1, 2, None])
plt.scatter(x, y)
plt.show()
pandas
使用NaN
来表示屏蔽数据,而屏蔽数组使用单独的屏蔽数组。这意味着屏蔽数组可能会保留原始数据,同时暂时将其标记为"缺少"或者"坏"。但是,它们使用更多内存,并且使用NaN
来表示缺失数据可以避免隐藏的问题。
另一个例子,同时使用蒙版数组和NaN
s,这次是一个线图:
import numpy as np
import matplotlib.pyplot as plt
x = np.linspace(0, 6 * np.pi, 300)
y = np.cos(x)
y1 = np.ma.masked_where(y > 0.7, y)
y2 = y.copy()
y2[y > 0.7] = np.nan
fig, axes = plt.subplots(nrows=3, sharex=True, sharey=True)
for ax, ydata in zip(axes, [y, y1, y2]):
ax.plot(x, ydata)
ax.axhline(0.7, color='red')
axes[0].set_title('Original')
axes[1].set_title('Masked Arrays')
axes[2].set_title("Using NaN's")
fig.tight_layout()
plt.show()
答案 1 :(得分:1)
因为您在2D空间中绘图,所以您的点需要由X和Y值定义。如果其中一个值为None,则该点不能存在于2D空间中,因此无法绘制,因此您应该从其他列表中删除None及其对应的值。
有很多方法可以实现这一目标。这是一个:
a = [1, 2, 3]
b = [1, None, 2]
i = 0
while i < len(a):
if a[i] == None or b[i] == None:
a = a[:i] + a[i+1:]
b = b[:i] + b[i+1:]
else:
i += 1
"""Now a = [1, 3] and b = [1, 2]"""
pylab.scatter(a,b)