Pandas / Python / Matplotlib散点图标记颜色取决于单元格中的值

时间:2017-03-25 15:46:25

标签: python pandas matplotlib colors scatter

我一直在寻找有关如何根据“第三”列的值在散点图上设置点的解决方案。我找不到任何现成的解决方案,因此我构建了自己的解决方案,我想分享它(也许有人会利用它):) 如果这不是发布的地方,那么我很抱歉,请将其删除。

让我们假设有一个数据框'scatterData',如下所示:

    lad2014_name    Male    Female  Result
0   ABERDEEN CITY   95154   97421   -21.78
1   ABERDEENSHIRE   101875  105141  -13.10
2   ADUR    24047   26574   -16.16
3   ALLERDALE       38346   40192   -44.56
.
.
.
499 AMBER VALLEY    48720   51502   -3.56

我想在散点图上绘制男性和女性,但我还想通过更改标记的颜色来显示“结果”是否为负或正。所以我这样做了:

def resultColour(z):
    colour = '#e31a1c'
    if z > 0:
        colour = '#1f78b4'
    return colour

#Plotting the scatter plot
plt.figure(figsize=(12,10))

for index, row in scatterData.iterrows(): 
    x = row.Male
    z = row.Result
    y = row.Female
    t = resultColour(z)
    plt.scatter(x, y, c=t,s=85)
plt.xlabel('X axis lable',fontsize=15)
plt.ylabel('Y axis lable',fontsize=15)

plt.title('Plot title',fontsize=18)

plt.plot()

它产生分散如下

Scatter plot

1 个答案:

答案 0 :(得分:0)

您实际上可以在c中为plt.scatter关键字参数提供一系列值。它们将根据您可以使用cmap关键字设置的色彩映射映射到标记颜色。

示例:

import pandas as pd
import numpy as np
from matplotlib import pyplot as plt
from matplotlib import cm

np.random.seed(0)
df = pd.DataFrame({'x':np.random.randint(0,10,size=20),
                   'y':np.random.randint(0,10,size=20),
                   'z':np.random.uniform(-1,1,size=20)})

plt.figure(figsize=(5,5))
plt.scatter(df.x, df.y, c = df.z>0, cmap = cm.RdYlGn)

可生产

a colored scatterplot

cm模块有一个很大的selection of colormaps。如果您需要自己的确切颜色,那么您可以使用如下所列的颜色映射:

cmap = matplotlib.colors.ListedColormap(['#e31a1c','#1f78b4'])
plt.scatter(df.x, df.y, c = df.z>0, cmap = cmap)