我目前正在构建一维CNN进行分类。预测变量是光谱(具有779个特征的 X -矩阵),并且因变量包含两个类别。
但是, X 矩阵包含重复的测量值(一系列15-20次重复)。至关重要的是,在训练过程中,重复测量不应同时包含在训练和损失函数评估中。有没有办法避免这种情况的“定制”迷你批次?
答案 0 :(得分:0)
您应该尝试使用数据生成器。
DataGenerator是一个对象,该对象将X_train和y_train矩阵作为输入,并按照某些条件将样本分成批处理。它也可以用于处理无法一次加载到虚拟内存上的大量数据。
这里是一个如何实现的示例!
基本上get_item将为您提供下一个批处理,以便在这里实现您可能需要的所有条件。
symbol_id
来源:This