我有一个包含日期和值的83000行的大数据集。我想生成一个具有移动平均值和时间的图。但我的图表并不清楚,你可能会在图片中看到。如何调整图表并使其更清晰?有没有其他方法来绘制像这样的大数据集?当我看这张图时,很多线条就像是相互叠加而且它们并不是很重要?
答案 0 :(得分:0)
鉴于此数据框:
df.head()
complete mid_c mid_h mid_l mid_o time
0 True 0.80936 0.80943 0.80936 0.80943 2018-01-31 09:54:10+00:00
1 True 0.80942 0.80942 0.80937 0.80937 2018-01-31 09:54:20+00:00
2 True 0.80946 0.80946 0.80946 0.80946 2018-01-31 09:54:25+00:00
3 True 0.80942 0.80942 0.80940 0.80940 2018-01-31 09:54:30+00:00
4 True 0.80944 0.80944 0.80944 0.80944 2018-01-31 09:54:35+00:00
创建50移动平均线:
df['ma'] = df.mid_c.rolling(window=50).mean()
绘制它:
df.plot('time', ['mid_c', 'ma'])
import matplotlib.pyplot as plt
plt.show()