我有时间序列数据,其中时间序列中的每个点也是类别的一部分。共有3个类别,通常彼此之间的几个点位于同一类别中。我希望能够绘制时间序列,但是要根据观察结果所在的类别更改线条的颜色。
我目前有一个解决方案,该解决方案具有时间序列,然后根据观察结果的类别为每个观察值着色点,但是看起来很混乱。
我还尝试了将类别分为3个数据集,并分别绘制它们,但是当类别在系列中更改时,线不会连接
我目前正在使用python,但是由于我拥有数据集,因此我不仅限于python解决方案。
数据快照:
Date Value Group
2016-04-01 0.65 2
2016-04-02 0.66 0
2016-04-03 0.65 0
2016-04-04 0.69 1
答案 0 :(得分:0)
这应该是您想要的,我也使用熊猫:
import pandas as pd
import matplotlib.pyplot as mpl
df = pd.read_csv("data.txt", sep='\s+') #or however you build the dataframe with pandas
for i in range(len(df.index)):
if df.loc[i,'Group'] == 0:
col = 'g' #green
elif df.loc[i,'Group'] == 1:
col = 'r' #red
elif df.loc[i,'Group'] == 2:
col = 'c' #cyan
subdf = df.loc[i:i+2] #selecting two points
mpl.plot(subdf['Date'], subdf['Value'], 'o'+col) #plot bullet points
mpl.plot(subdf['Date'], subdf['Value'], col) #plot connecting line
mpl.show()
这是结果:
这个想法是遍历该系列,每对都绘制两次,前者绘制项目符号点,后者绘制连接段。从组中选择颜色(here颜色列表)。
我添加了项目符号点以显示最后一点的不同颜色:它可能属于不同的组。段的颜色对应于与第一点的组相关的颜色。