如何填充该图中的区域?

时间:2018-09-23 15:52:42

标签: python matplotlib

我想在下面的图中填写蓝色的“位置”部分。数据本身标志着位置发生了重大变化,是15分钟样本中的时间序列,并重复了最后一个位置,直到发生新的位置变化事件为止。因此,例如,一旦注册了“ home”,其列将保持为1,其他均为0。然后,当下一次访问“ work”时,该列将变为1,而home与其他列的连接为0。

plot with locations

u1 = userLocAppDfs['user_3'].copy()
# https://stackoverflow.com/questions/11927715/how-to-give-a-pandas-matplotlib-bar-graph-custom-colors
locations = [(x/8.75, x/40.0, 0.85) for x in range(5)] # color grad

u1[[' bar', ' grocers', ' home', ' lunch', ' work']].plot(color=locations, figsize=(15,10))

u1[' app_3'].plot(color='orange')
u1[' app_1'].plot(color='r')

我注意到fillstyle ='full'没有做任何事情。填写我的图形区域的正确方法是什么?

样本数据

    app_1   app_2   user    bar grocers home    lunch   park    relatives   work
date                                        
2017-08-29 14:00:00 0.013953    0.052472    user_1  0.0 0.0 0.0 0.0 0.0 0.0 1.0
2017-08-29 14:15:00 0.014070    0.052809    user_1  0.0 0.0 0.0 0.0 0.0 0.0 1.0
2017-08-29 14:30:00 0.014186    0.053146    user_1  0.0 0.0 1.0 0.0 0.0 0.0 0.0
2017-08-29 14:45:00 0.014302    0.053483    user_1  0.0 0.0 1.0 0.0 0.0 0.0 0.0
2017-08-29 15:00:00 0.014419    0.053820    user_1  0.0 0.0 1.0 0.0 0.0 0.0 0.0

1 个答案:

答案 0 :(得分:1)

我认为直接使用DataFrame中的熊猫绘图是不可能的,但是您可以使用matplotlib中的fill_between。您需要在数据框的每一列(“栏”,“家”,“工作”等)上执行此操作。您可以手动创建一个轴,并告诉matplotlib和pandas绘制到该轴上

import matplotlib.pyplot as plt
fig, ax = plt.subplots(1,1)
for location in [' bar', 'grocers', ' home']:  # or whatever subset of columns you want
    ax.fill_between(range(len(u1[location]), u1[location], step='post')

u1[' app_3'].plot(ax=ax, color='orange')
# etc..

P.S。 fillstyle参数用于当您为每个数据点都有一个标记并且您想要修改其外观时:https://matplotlib.org/gallery/lines_bars_and_markers/marker_fillstyle_reference.html


编辑:使用您提供的数据更新了示例。我修改了数据,在工作地点和住所之间的小节上添加了一个停靠点,以提供更好看的情节。

import matplotlib.pyplot as plt
import pandas as pd

columns = ['date', 'app_1', 'app_2', 'user', 'bar', 'grocers', 'home', 'lunch', 'park', 'relatives', 'work']
data = [['2017-08-29 14:00:00', 0.013953, 0.052472, 'user_1', 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 1.0], ['2017-08-29 14:15:00', 0.014070, 0.052809, 'user_1', 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 1.0], ['2017-08-29 14:30:00', 0.014186, 0.053146, 'user_1', 0.0, 0.0, 1.0, 0.0, 0.0, 0.0, 0.0], ['2017-08-29 14:45:00', 0.014302, 0.053483, 'user_1', 0.0, 0.0, 1.0, 0.0, 0.0, 0.0, 0.0], ['2017-08-29 15:00:00', 0.014419, 0.053820, 'user_1', 0.0, 0.0, 1.0, 0.0, 0.0, 0.0, 0.0]]

df = pd.DataFrame(data, columns=columns)
height = df[['app_1', 'app_2']].max().max()

fig, ax = plt.subplots(1,1)

df['app_1'].plot(ax=ax, color='orange')
df['app_2'].plot(ax=ax, color='purple')
ax.fill_between(range(len(df['home'])), height * df['home'], step='post', color='blue')
ax.fill_between(range(len(df['work'])), height * df['work'], step='post', color='red')

plt.show()

数据如下:

                  date     app_1     app_2    user  bar  grocers  home  lunch  park  relatives  work
0  2017-08-29 14:00:00  0.013953  0.052472  user_1  0.0      0.0   0.0    0.0   0.0        0.0   1.0
1  2017-08-29 14:15:00  0.014070  0.052809  user_1  0.0      0.0   0.0    0.0   0.0        0.0   1.0
2  2017-08-29 14:30:00  0.014186  0.053146  user_1  1.0      0.0   0.0    0.0   0.0        0.0   0.0
3  2017-08-29 14:45:00  0.014302  0.053483  user_1  0.0      0.0   1.0    0.0   0.0        0.0   0.0
4  2017-08-29 15:00:00  0.014419  0.053820  user_1  0.0      0.0   1.0    0.0   0.0        0.0   0.0

看起来像这样:

example