使用NaN绘制/创建数据集的散点图

时间:2013-04-02 00:48:36

标签: python matplotlib

我想使用pylab绘制散点图,但是,我的一些数据是NaN,如下所示:

a = [1, 2, 3]
b = [1, 2, None]

pylab.scatter(a,b)不起作用。

是否有某些方法可以在不显示这些NaN值的情况下绘制真实价值点?

2 个答案:

答案 0 :(得分:14)

如果您使用NaN,事情会完美无缺。 None不是一回事。 NaN是一个浮动。

举个例子:

import numpy as np
import matplotlib.pyplot as plt

plt.scatter([1, 2, 3], [1, 2, np.nan])
plt.show()

enter image description here

如果要处理丢失的数据,请查看pandas或numpy蒙面数组(以及numpy.genfromtxt来加载数据)。蒙面数组内置于numpy中,但pandas是一个非常有用的库,并且具有非常好的缺失值功能。

举个例子:

import matplotlib.pyplot as plt
import pandas

x = pandas.Series([1, 2, 3])
y = pandas.Series([1, 2, None])
plt.scatter(x, y)
plt.show()

pandas使用NaN来表示屏蔽数据,而屏蔽数组使用单独的屏蔽数组。这意味着屏蔽数组可能会保留原始数据,同时暂时将其标记为"缺少"或者"坏"。但是,它们使用更多内存,并且使用NaN来表示缺失数据可以避免隐藏的问题。

另一个例子,同时使用蒙版数组和NaN s,这次是一个线图:

import numpy as np
import matplotlib.pyplot as plt

x = np.linspace(0, 6 * np.pi, 300)
y = np.cos(x)

y1 = np.ma.masked_where(y > 0.7, y)

y2 = y.copy()
y2[y > 0.7] = np.nan

fig, axes = plt.subplots(nrows=3, sharex=True, sharey=True)
for ax, ydata in zip(axes, [y, y1, y2]):
    ax.plot(x, ydata)
    ax.axhline(0.7, color='red')

axes[0].set_title('Original')
axes[1].set_title('Masked Arrays')
axes[2].set_title("Using NaN's")

fig.tight_layout()

plt.show()

enter image description here

答案 1 :(得分:1)

因为您在2D空间中绘图,所以您的点需要由X和Y值定义。如果其中一个值为None,则该点不能存在于2D空间中,因此无法绘制,因此您应该从其他列表中删除None及其对应的值。

有很多方法可以实现这一目标。这是一个:

a = [1, 2, 3]
b = [1, None, 2]

i = 0
while i < len(a):
    if a[i] == None or b[i] == None:
        a = a[:i] + a[i+1:]
        b = b[:i] + b[i+1:]
    else:
        i += 1

"""Now a = [1, 3] and b = [1, 2]"""

pylab.scatter(a,b)