变长数据训练-脑电数据分类

时间:2018-09-22 08:18:40

标签: machine-learning neural-network deep-learning time-series pytorch

我是一名学生,正在研究一个项目,该项目涉及使用EEG数据进行测谎。我将使用来自2个通道的原始EEG数据,并将在主题回复问题的过程中记录EEG数据。因此,数据将是存储在csv文件中的2乘可变长度数组,该数组保存来自两个传感器中每个传感器的传感器读数。例如,它看起来像这样:

Time (ms) | Sensor 1 | Sensor 2|
--------------------------------
10        | 100.2    | -324.5  |
20        | 123.5    | -125.8  |
30        | 265.6    | -274.9  |
40        | 121.6    | -234.3  |
             ....
2750      | 100.2    | -746.2  |

我想根据这些数据预测受试者是在说谎还是在说真话(因此是二进制分类)。我正计划将其简单地视为结构化数据,并以此为基础进行训练。但是,再三考虑,由于某些原因,这根本不起作用:

  1. 数据的组织顺序很重要,因为它是连续时间数据。
  2. 数据的长度是可变的,因为它是时间数据,而被测者说谎/告诉事实的时间不一致。
  3. 我不知道如何处理多个数据通道。

我将如何为此类数据建立训练模型?我认为这是一个“时间序列分类”问题,但我不确定。任何形式的帮助将不胜感激。预先谢谢你!

1 个答案:

答案 0 :(得分:0)

经过更多研究后,我决定将 LSTM network 与运行在TensorFlow之上的Keras框架一起使用。 LSTM处理时间序列数据,而Keras层允许将多个特征时间序列数据馈入网络,因此,如果有人遇到与我的相似的问题,那么LSTM或RNN就是解决之道。