Matplotlib图调整与大数据集

时间:2018-01-31 11:43:32

标签: python pandas matplotlib data-visualization seaborn

我有一个包含日期和值的83000行的大数据集。我想生成一个具有移动平均值和时间的图。但我的图表并不清楚,你可能会在图片中看到。如何调整图表并使其更清晰?有没有其他方法来绘制像这样的大数据集?当我看这张图时,很多线条就像是相互叠加而且它们并不是很重要?

(我通常使用Python的matplotlib和seaborn库) you may see an example graph here

1 个答案:

答案 0 :(得分:0)

鉴于此数据框:

df.head()
   complete    mid_c    mid_h    mid_l    mid_o                      time 
0      True  0.80936  0.80943  0.80936  0.80943 2018-01-31 09:54:10+00:00   
1      True  0.80942  0.80942  0.80937  0.80937 2018-01-31 09:54:20+00:00   
2      True  0.80946  0.80946  0.80946  0.80946 2018-01-31 09:54:25+00:00   
3      True  0.80942  0.80942  0.80940  0.80940 2018-01-31 09:54:30+00:00   
4      True  0.80944  0.80944  0.80944  0.80944 2018-01-31 09:54:35+00:00   

创建50移动平均线:

df['ma'] = df.mid_c.rolling(window=50).mean()

绘制它:

df.plot('time', ['mid_c', 'ma'])

import matplotlib.pyplot as plt

plt.show()

enter image description here