我试图显示5种不同颜色的散点图:每种颜色一个' district
'。不幸的是,我出现了此错误:Invalid RGBA argument: nan
我的数据框如下所示:
> price surface district
> 0 1850 46 1.0
> 1 1900 41 4.0
> 2 1925 55 4.0
> 3 1960 52 2.0
> 4 2025 57 3.0
> 5 2055 60 10.0
... ... ... ...
这就是我所做的:
colors =['red', 'pink', 'limegreen', 'violet', 'cyan']
color_dict = dict(zip(np.unique(house['district']),colors))
因此颜色词典看起来像这样:
{1.0: 'red', 2.0: 'pink', 3.0: 'limegreen', 4.0: 'violet', 10.0: 'cyan'}
然后我创建了一个变量col:
col = house['district'].map(color_dict)
最后,我绘制了情节:
df.plot(kind = 'scatter', x = 'surface', y = 'price', c = col)
有人可以解释这里的问题是什么吗?
答案 0 :(得分:0)
所以,似乎在我的数据框中某处存在Nan值,即使我没有发现它们。 正如@coldspeed建议的那样,我只需要调用df.dropna()。
对我感到羞耻! ;)