当我绘制时间序列离群值时,Matplotlib永远不会完成。我的数据集太大还是我的代码不正确?
我已经在时间序列数据中进行了一些离群值检测,现在我正尝试在时间序列数据的线图上使用散点图来绘制这些离群值。
但是,当我运行下面的代码时,内核会一直运行而没有结果,直到我被迫中断它。我的数据包含大约140,000个时间序列数据点,而我有大约2,800个离群值。
数据段:
index Time Series Outlier
2018-09-01 00:57:00 28.53 0
2018-09-01 00:58:00 28.49 0
2018-09-01 00:59:00 28.46 0
代码:
fig, ax = plt.subplots(figsize = (36,36))
OL = df.loc[df["Outlier"] == 1, ["Time Series"]]
ax.plot(df["Time Series"], color='blue')
ax.scatter(OL.index,OL["Time Series"], color='red')
plt.show()
预期输出应类似于下图。
我应该更改后端吗?还是减少数据集?
任何帮助将不胜感激!