我开发了一种算法来检测时域中的事件,我想知道算法的效率。
问题与数据的持续时间有关。
每个文件都有持续数百分钟的数据,而且我有几十个文件。
我没有计算这个算法对整个数据集的特异性和灵敏度,而是考虑选择随机样本。
我的问题是:
进行有效统计分析的正确方法是什么?
更新
我正在研究时域中的声音。通常这种声音具有低振幅轮廓,只有噪音。有时会产生声音并且信号幅度会增加。
该算法的目标是检测信号幅度的这种增加。不幸的是,声音的产生可以被解释为随机的。低振幅轮廓可能持续数分钟甚至数小时而不会产生单一声音。另一方面,声音n + 1和声音n只有几秒之间的时间差可能会有几分钟的声音序列。
我关注检测的质量,敏感性和特异性。这意味着希望知道是否检测到生成的声音,以及是否在没有声音的情况下检测到“检测到”的声音。
我没有任何先验信息,只有算法给出的信息。