如何训练具有多个数据集的ML模型?

时间:2019-11-22 18:50:15

标签: tensorflow machine-learning merge dataset lstm

我想通过使用来自2个数据集MIMIC-1.0MIMIC-3的数据来训练多元LSTM模型。我面临的问题是,第一个数据集中记录的生命体征是一分钟一分钟的,而在MIMIC-III中,数据是每小时记录一次.bot数据集中的数据记录之间存在时间间隔差异。每5分钟将生命体征的流/序列提供给模型给生命体征。如何合并模型的两个数据集。

2 个答案:

答案 0 :(得分:0)

您需要能够找到可用于合并的公共字段。例如Patient_ids或类似。您可以对ICU剧集标识符执行相同的操作。自从我从事MIMIC数据集的工作以来,已经确切地回忆起这些字段是什么了。

答案 1 :(得分:0)

<头>
数据集 粒度 每 5 分钟进行二次采样
MIMIC-I 每分钟 每 5 次读数进行二次采样
MIMIC-III 每小时 在每对连续的每小时读数之间插入 10 个 5 分钟读数

您选择的用于获取小时读数之间的插值方法可能就像向前填充最后一个值一样简单。如果读数更不稳定,more complex method 可能更合适。