我有一个由一列组成的简单数据框。在该列中有10320个观测值(数值)。我通过将数据插入到具有每个200个观测值的窗口的图中来模拟时间序列数据。这是绘图的代码。
import matplotlib.pyplot as plt
from IPython import display
fig_size = plt.rcParams["figure.figsize"]
import time
from matplotlib.backends.backend_agg import FigureCanvasAgg as FigureCanvas
fig, axes = plt.subplots(1,1, figsize=(19,5))
df = dframe.set_index(arange(0,len(dframe)))
std = dframe[0].std() * 6
window = 200
iterations = int(len(dframe)/window)
i = 0
dframe = dframe.set_index(arange(0,len(dframe)))
while i< iterations:
frm = window*i
if i == iterations:
to = len(dframe)
else:
to = frm+window
df = dframe[frm : to]
if len(df) > 100:
df = df.set_index(arange(0,len(df)))
plt.gca().cla()
plt.plot(df.index, df[0])
plt.axhline(y=std, xmin=0, xmax=len(df[0]),c='gray',linestyle='--',lw = 2, hold=None)
plt.axhline(y=-std , xmin=0, xmax=len(df[0]),c='gray',linestyle='--', lw = 2, hold=None)
plt.ylim(min(dframe[0])- 0.5 , max(dframe[0]) )
plt.xlim(-50,window+50)
display.clear_output(wait=True)
display.display(plt.gcf())
canvas = FigureCanvas(fig)
canvas.print_figure('fig.png', dpi=72, bbox_inches='tight')
i += 1
plt.close()
这模拟了实时数据流并使其可视化。我想要的是将数据RNN LSTM应用于数据以检测无监督的异常。因为我无人监管,所以我不认为我需要将数据分成训练和测试集。到目前为止,我还没有发现任何对我有意义的事情,并且已经谷歌搜索了大约2个小时。只是希望你们可以提供帮助。我想将RNN的预测输出也放在图上,并定义一个阈值,如果误差太大,则该值将被识别为异常。如果您需要更多信息,请发表评论并告诉我们。谢谢!
答案 0 :(得分:2)
<强>阅读强>
<强>解强>
说完这个
此方案将失败,好像训练不正确会出现错误预测错误,这是非异常。因此,请确保提供足够的培训,并且最重要的随机播放培训框和考虑所有变体。