我的任务是预测测试实例所处的状态。我的列车集具有M个实例时间序列,每个实例具有不同的持续时间。每个实例在列车数据中有5个状态(s1,s2,s3,s4,s5)。对于每个实例,所有状态都以相同的顺序出现。在我的测试数据中,并非所有实例都具有所有5个状态。我的目标是预测特定实例所处的状态。未给出类标签。我已经执行了分层聚类来分割每个列车实例。在预测时,我使用快速DTW来查找特定测试实例与所有M列实例的相似性。我选择距离最小的那个。我使用此列车模型来查找测试实例的当前状态。
但我不确定这会有多准确。我可以将具有簇号的分类器应用为标签但我希望有更强大的方法,因为我的数据是高维度的。在执行DTW时是否需要考虑任何性能指标?使用分类限制我,因为我的测试集没有所有状态信息,我应该将我的数据限制为仅训练集。显然,可能无法预测当前状态。