在pandas

时间:2015-09-11 14:21:13

标签: python pandas

我正在尝试在pandas中绘制一些数据,并且内置的绘图功能可以方便地绘制每列一行。我想要做的是根据我制作的分类手动为每一行分配颜色。

以下作品:

df = pd.DataFrame({'1': [1, 2, 3, 4], '2': [1, 2, 1, 2]})
s = pd.Series(['c','y'], index=['1','2'])
df.plot(color = s)

但是当我的索引是整数时,它不再起作用并抛出KeyError:

df = pd.DataFrame({1: [1, 2, 3, 4], 2: [1, 2, 1, 2]})
s = pd.Series(['c','y'], index=[1,2])
df.plot(color = s)

我理解它的方式是,当使用整数索引时,它必须从0开始。这是我的猜测,因为以下也适用:

df = pd.DataFrame({0: [1, 2, 3, 4], 1: [1, 2, 1, 2]})
s = pd.Series(['c','y'], index=[1,0])
df.plot(color = s)

我的问题是:

  • 这里发生了什么事?
  • 假设我有一个不是从0开始的整数索引或者不是由连续数字组成的,那么如何在不必将索引转换为字符串或从0开始重新索引的情况下完成这项工作?

编辑:

我意识到即使在第一种情况下,代码也没有按照我的预期去做。 似乎pandas仅匹配DataFrame和Series的索引,如果两者都是从0开始的整数索引。如果不是这种情况,则抛出KeyError或者如果索引是str,则使用元素的顺序。

这是对的吗?有没有办法匹配Series和DataFrame索引?或者我是否必须确保以正确的顺序传递颜色列表?

3 个答案:

答案 0 :(得分:7)

这里发生了什么?

关键字参数颜色继承自matplotlib.pyplot.plot()。文档中的详细信息并未明确表示您可以在绘图时输入颜色列表。鉴于颜色是来自matplotlib的关键字参数,我建议不要使用Pandas系列来保存颜色值。

我该如何使用?

使用列表而不是系列。如果您使用的索引系列旨在将DataFrame的列与特定颜色相匹配,则需要先对系列进行排序。如果列不符合要求,则还需要sort the columns

# Option 1
s = s.sort_index()
df.plot(color = s.values) # as per Fiabetto's answer

# Option 2
df.plot(color = ['c', 'y']) # other method

答案 1 :(得分:3)

尝试:

df.plot(color = s.values)

这将分配颜色,无论索引的比例如何。

编辑:

我试过三栏:

df = pd.DataFrame({'1': [1, 2, 3, 4], '2': [1, 2, 1, 2], '3': [4, 3, 2, 1]})
s = pd.Series(['c','y','r'], index=[1,3,2])
df.plot(color = s.sort_index().values)

并对系列进行排序。

答案 2 :(得分:0)

要为每条线设置颜色,您可以使用参数 O(n^2)。例如:

style

enter image description here

使用 marker|line|color 形式的 shortcut string notation 您还可以设置标记和线条类型:

df = pd.DataFrame({'A': [1, 2, 4], 'B': [1, 3, 9]})
df.plot(style={'A': 'r', 'B': 'g'})

enter image description here