对于我的实验,我准备了一个非常小的时间序列数据,其中的三列格式如下。由于无法在stackoverflow上附加文件,因此此处附有完整的数据集以提高可重复性:
http://www.mediafire.com/file/el1tkrdun0j2dk4/testdata.csv/file
time X Y
0.040662 1.041667 1
0.139757 1.760417 2
0.144357 1.190104 1
0.145341 1.047526 1
0.145401 1.011882 1
0.148465 1.002970 1
.... ..... .
我们想进行平滑处理,这是我的代码
import matplotlib.pyplot as plt
from pykalman import KalmanFilter
import numpy as np
import pandas as pd
df = pd.read_csv('testdata.csv')
print(df)
pd.set_option('use_inf_as_null', True)
df.dropna(inplace=True)
X = df.drop('Y', axis=1)
y = df['Y']
d1= np.array(X)
d2 = np.array(y)
measurements = np.asarray(d1)
kf = KalmanFilter(transition_matrices=[1],
observation_matrices=[1],
initial_state_mean=measurements[0],
initial_state_covariance=1,
observation_covariance=5,
transition_covariance=1)
state_means, state_covariances = kf.filter(measurements)
state_std = np.sqrt(state_covariances[:,0])
print (state_std)
print (state_means)
print (state_covariances)
plt.plot(measurements, '-r', label='measurment')
plt.plot(state_means, '-g', label='kalman-filter output')
plt.legend(loc='upper left')
plt.show()
如果像我在上面的代码中那样只考虑X和Y列,它将给出以下绘图输出
我想在time
上保留第一列('x-axis
)(1-10),在y-axis
上保留第二列(X)的值。
但是,当我尝试在数据集(time
)中添加第一列时,出现以下错误
ValueError: The shape of all parameters is not consistent. Please re-check their values.
如何解决此问题?任何帮助,将不胜感激。
答案 0 :(得分:1)
您可以进行以下更改:
1添加measurements[0,1]
,因此intial_state_mean
的输入是一个值。这应该摆脱您看到的错误。
kf = KalmanFilter(transition_matrices=[1],
observation_matrices=[1],
initial_state_mean=measurements[0,1], # Change here
initial_state_covariance=1,
observation_covariance=5,
transition_covariance=1)
2将输入更改为kf.filter
,以仅包括X列:measurements[:,1]
。
state_means, state_covariances = kf.filter(measurements[:,1]) # Change here
state_std = np.sqrt(state_covariances[:,0])
print (state_std)
print (state_means)
print (state_covariances)
3在x轴上绘制time
。
plt.plot(measurements[:,0], measurements[:,1], '-r', label='measurment') # Change here
plt.plot(measurements[:,0], state_means, '-g', label='kalman-filter output') # Change here
plt.legend(loc='upper left')
plt.show()