如何在时间序列数据中标记类别?

时间:2019-03-28 22:13:11

标签: python

我有时间序列数据,其中时间序列中的每个点也是类别的一部分。共有3个类别,通常彼此之间的几个点位于同一类别中。我希望能够绘制时间序列,但是要根据观察结果所在的类别更改线条的颜色。

我目前有一个解决方案,该解决方案具有时间序列,然后根据观察结果的类别为每个观察值着色点,但是看起来很混乱。

我还尝试了将类别分为3个数据集,并分别绘制它们,但是当类别在系列中更改时,线不会连接

我目前正在使用python,但是由于我拥有数据集,因此我不仅限于python解决方案。

数据快照:

Date         Value      Group
2016-04-01   0.65       2 
2016-04-02   0.66       0 
2016-04-03   0.65       0 
2016-04-04   0.69       1 

1 个答案:

答案 0 :(得分:0)

这应该是您想要的,我也使用熊猫:

import pandas as pd
import matplotlib.pyplot as mpl

df = pd.read_csv("data.txt", sep='\s+') #or however you build the dataframe with pandas

for i in range(len(df.index)):
    if df.loc[i,'Group'] == 0:
        col = 'g' #green
    elif df.loc[i,'Group'] == 1:
        col = 'r' #red
    elif df.loc[i,'Group'] == 2:
        col = 'c' #cyan
    subdf = df.loc[i:i+2] #selecting two points
    mpl.plot(subdf['Date'], subdf['Value'], 'o'+col) #plot bullet points
    mpl.plot(subdf['Date'], subdf['Value'], col) #plot connecting line

mpl.show()

这是结果:

enter image description here

这个想法是遍历该系列,每对都绘制两次,前者绘制项目符号点,后者绘制连接段。从组中选择颜色(here颜色列表)。
我添加了项目符号点以显示最后一点的不同颜色:它可能属于不同的组。段的颜色对应于与第一点的组相关的颜色。