我有大约10分钟的eeg数据。我想从这些数据中提取一些特征(例如统计特征,功率谱特征,通道间特征……),以将其应用于机器学习算法。因此,我使用3秒的窗口(重叠50%)在eeg信号上滑动。之后,由于取值范围不同,我使用z分数归一化对功能进行了归一化,如下所示:
值是特征向量,mu和sigma是该向量的均值和标准差。为了进一步使用,我想保存这些参数(mu,sigma),以在应用到机器学习算法之前用相同的参数对新信号(测试数据)进行归一化,但是在这种情况下,我将为每个窗口保存过多的参数。我现在该怎么办?
一种可能的方法是,首先(在训练集中)从所有信号中提取特征(10秒),这是一项耗时的工作,然后对其进行规范化并保存其mu和sigma参数(针对每个特征) 。之后,使用窗口化功能,还提取窗口的特征,并使用保存的参数对其进行规范化。这意味着从所有信号中保存的mu和sigma可用于训练和测试数据(一次用于训练阶段并保存参数并始终使用它们),但是我不确定这种解决方案是否正确!