无监督学习时态数据的最新技术是什么?

时间:2012-08-07 21:06:12

标签: machine-learning cluster-analysis time-series pattern-recognition unsupervised-learning

我正在寻找

最先进方法的概述
  • 时间数据中找到时间模式(任意长度)

  • 无人监管(无标签)。

换句话说,给定一个(可能是高维度)数据的蒸汽/序列,您如何找到最能捕获该结构的公共子序列 数据

  1. 欢迎任何关于最新发展或论文(超出HMM的希望)的指示!

  2. 这个问题是否可以理解 在更具体的应用领域,如

    • 动作捕捉
    • 语音处理
    • 自然语言处理
    • 游戏动作序列
    • 股市预测?

  3. 此外,这些方法中的一些通常足以应对
    • 高度嘈杂的数据
    • 层次结构
    • 在时间轴上不规则间隔
  4. (我对检测已知模式感兴趣,也不对分类或分割序列感兴趣。)

2 个答案:

答案 0 :(得分:6)

最近有很多强调非参数HMM,无限状态空间的扩展,以及因子模型,使用一组因子而不是单一混合成分来解释观察。

以下是一些有趣的论文(只是谷歌的纸名):

  • “无限隐马尔可夫模型的光束采样”
  • “无限因子隐马尔可夫模型”
  • “切换动态线性模型的贝叶斯非参数推断”
  • “使用beta流程在动态系统之间共享功能”

这些论文的实验部分讨论了文本建模,说话人日记和动作捕捉等方面的应用。

答案 1 :(得分:0)

我不知道您正在分析的数据类型,但我建议(从动态系统分析的角度来看),看看:

  • 重现情节(很容易找到谷歌搜索)
  • 延时嵌入(可能会展现数据不同维度之间的潜在关系)+ 距离矩阵(可能会研究邻域模式?)

请注意,这只是表示数据的另一种方式,并根据此新表示进行分析。只是一个建议!