应用错误收集

我有大约10分钟的eeg数据。我想从这些数据中提取一些特征（例如统计特征，功率谱特征，通道间特征……），以将其应用于机器学习算法。因此，我使用3秒的窗口（重叠50％）在eeg信号上滑动。之后，由于取值范围不同，我使用z分数归一化对功能进行了归一化，如下所示：

值是特征向量，mu和sigma是该向量的均值和标准差。为了进一步使用，我想保存这些参数（mu，sigma），以在应用到机器学习算法之前用相同的参数对新信号（测试数据）进行归一化，但是在这种情况下，我将为每个窗口保存过多的参数。我现在该怎么办？

一种可能的方法是，首先（在训练集中）从所有信号中提取特征（10秒），这是一项耗时的工作，然后对其进行规范化并保存其mu和sigma参数（针对每个特征）。之后，使用窗口化功能，还提取窗口的特征，并使用保存的参数对其进行规范化。这意味着从所有信号中保存的mu和sigma可用于训练和测试数据（一次用于训练阶段并保存参数并始终使用它们），但是我不确定这种解决方案是否正确！

窗口化以获取将来的测试数据后如何规范化功能？

0 个答案: