我试图根据熊猫DataFrame中的名称绘制带有颜色的matplotlib图。从而在x,y图中,不同的名称点具有不同的颜色。
数据框:
id x y Names
0 MAC004524 29.137983 11.864633 ACORN-M
1 MAC004525 28.14 11.80 ACORN-M
2 MAC004526 24.14 12.80 ACORN-C
....
代码:
names = set(df['Names'])
colors = list(cmap(np.linspace(0, 1, len(names))))
df['color']=0
for a, c in zip(names, colors):
mask = df.loc[df['Names'] == a]
df.loc[mask, 'color'] = c
#but get an error here KeyError: "[('i', 'd') ('x',) ('y',) ('A', 'c', 'o', 'r', 'n')\n ('A', 'c', 'o', 'r', 'n', '_', 'g', 'r', 'o', 'u', 'p', 'e', 'd')\n ('c', 'o', 'l', 'o', 'r')] not in index"
然后我想绘制
x = df['x']
y = df['y']
c= df['color']
plt.scatter(x, y, c=c, s=1)
必需的df:
id x y Names color
0 MAC004524 29.137983 11.864633 ACORN-M [0.267004 0.004874 0.329415 1. ]
答案 0 :(得分:1)
问题应该出在试图在单元格上放置列表。如here所示,您应该使用.at而不是.loc。
可能不是最有效的方法,但可以完成工作:
for a, c in zip(names, colors):
mask = df[df['Names'] == a].index
for value in mask:
df.at[value, 'color'] = c
我添加了索引,并遍历了它的每个值,以替换为指定的颜色,因为我还没有找到将多个值添加到.at命令的行索引的方法。
答案 1 :(得分:1)
您是否研究过海图?您可以立即从原始数据框中进行绘制:
import seaborn as sns
sns.scatterplot(x='x', y='y', hue='Names', data=df)