让我们考虑一些2D信号(幅度随时间变化)。
我有一个具有特定“形状”的代码片段库。为了举例说明,我们假设一个方波,一个三角波和一个锯齿波,但是实际上它们要复杂得多。
我有一个复杂的信号,例如录音。
要知道,训练系统识别复杂信号中库中元素的最佳方法是什么,
我想恢复的是:
该形状适合复杂信号(位置,频率,幅度范围)的何处。
奖金问题:由于我正在寻找形状本身,因此它可能会随着时间以非线性方式拉伸。
我画了一张简短的图片来说明:
在这里作为示例,我为库绘制了3种基本形状,并且在音频信号的不同位置重叠了一些形状。
解决此问题的最佳方法是什么?
我倾向于训练一个分类器来识别形状,但是我不确定这是正确的方法,也不确定这种频率分布在很宽范围内(50hz)的数据的实用性到15khz)。
答案 0 :(得分:0)
如果没有标签数据集,我可能会尝试简化的卷积自动编码器。
如果您要识别的基本形状是固定的,我会使用 将内核功能设置为基本形状的单个隐藏层(瓶颈)。瓶颈处的神经元值会告诉您检测到哪些形状以及在何处。