Question

我正在尝试在pandas中绘制一些数据，并且内置的绘图功能可以方便地绘制每列一行。我想要做的是根据我制作的分类手动为每一行分配颜色。

以下作品：

df = pd.DataFrame({'1': [1, 2, 3, 4], '2': [1, 2, 1, 2]})
s = pd.Series(['c','y'], index=['1','2'])
df.plot(color = s)

但是当我的索引是整数时，它不再起作用并抛出KeyError：

df = pd.DataFrame({1: [1, 2, 3, 4], 2: [1, 2, 1, 2]})
s = pd.Series(['c','y'], index=[1,2])
df.plot(color = s)

我理解它的方式是，当使用整数索引时，它必须从0开始。这是我的猜测，因为以下也适用：

df = pd.DataFrame({0: [1, 2, 3, 4], 1: [1, 2, 1, 2]})
s = pd.Series(['c','y'], index=[1,0])
df.plot(color = s)

我的问题是：

这里发生了什么事？
假设我有一个不是从0开始的整数索引或者不是由连续数字组成的，那么如何在不必将索引转换为字符串或从0开始重新索引的情况下完成这项工作？

编辑：

我意识到即使在第一种情况下，代码也没有按照我的预期去做。似乎pandas仅匹配DataFrame和Series的索引，如果两者都是从0开始的整数索引。如果不是这种情况，则抛出KeyError或者如果索引是str，则使用元素的顺序。

这是对的吗？有没有办法匹配Series和DataFrame索引？或者我是否必须确保以正确的顺序传递颜色列表？

Answer 1

这里发生了什么？

关键字参数颜色继承自matplotlib.pyplot.plot()。文档中的详细信息并未明确表示您可以在绘图时输入颜色列表。鉴于颜色是来自matplotlib的关键字参数，我建议不要使用Pandas系列来保存颜色值。

我该如何使用？

使用列表而不是系列。如果您使用的索引系列旨在将DataFrame的列与特定颜色相匹配，则需要先对系列进行排序。如果列不符合要求，则还需要sort the columns。

# Option 1
s = s.sort_index()
df.plot(color = s.values) # as per Fiabetto's answer

# Option 2
df.plot(color = ['c', 'y']) # other method

Answer 2

尝试：

df.plot(color = s.values)

这将分配颜色，无论索引的比例如何。

编辑：

我试过三栏：

df = pd.DataFrame({'1': [1, 2, 3, 4], '2': [1, 2, 1, 2], '3': [4, 3, 2, 1]})
s = pd.Series(['c','y','r'], index=[1,3,2])
df.plot(color = s.sort_index().values)

并对系列进行排序。

Answer 3

要为每条线设置颜色，您可以使用参数 O(n^2)。例如：

style

使用 marker|line|color 形式的 shortcut string notation 您还可以设置标记和线条类型：

df = pd.DataFrame({'A': [1, 2, 4], 'B': [1, 3, 9]})
df.plot(style={'A': 'r', 'B': 'g'})

在pandas

3 个答案: