窗口化以获取将来的测试数据后如何规范化功能?

时间:2019-11-10 13:19:01

标签: machine-learning neural-network signal-processing normalization feature-extraction

我有大约10分钟的eeg数据。我想从这些数据中提取一些特征(例如统计特征,功率谱特征,通道间特征……),以将其应用于机器学习算法。因此,我使用3秒的窗口(重叠50%)在eeg信号上滑动。之后,由于取值范围不同,我使用z分数归一化对功能进行了归一化,如下所示:

enter image description here

值是特征向量,mu和sigma是该向量的均值和标准差。为了进一步使用,我想保存这些参数(mu,sigma),以在应用到机器学习算法之前用相同的参数对新信号(测试数据)进行归一化,但是在这种情况下,我将为每个窗口保存过多的参数。我现在该怎么办?

一种可能的方法是,首先(在训练集中)从所有信号中提取特征(10秒),这是一项耗时的工作,然后对其进行规范化并保存其mu和sigma参数(针对每个特征) 。之后,使用窗口化功能,还提取窗口的特征,并使用保存的参数对其进行规范化。这意味着从所有信号中保存的mu和sigma可用于训练和测试数据(一次用于训练阶段并保存参数并始终使用它们),但是我不确定这种解决方案是否正确!

0 个答案:

没有答案