我将训练数据作为两个Tensor
对象(不是ndarray
):(ENTIRE_DATASET_SIZE,FEATURE_NUM)的trainData
和(ENTIRE_DATASET_SIZE,1)的trainValues
(有是1个输出值)。
我目前正在像这样将它们喂入我的模型:
model.fit_dyn(trainData, trainValues,
epochs: 36000,
steps_per_epoch: 1,
initial_epoch: startingEpoch,
verbose: 2,
validation_data: validation,
validation_steps: validationSampleCount,
callbacks: new ICallback[]{
Run.TensorBoard,
checkpoints,
});
我正在考虑按照建议in some places将训练数据分成几批,尽管这些数据完全适合内存。
我尝试过:
const int BatchSize = 1000;
var trainBatches = tf.split(
trainData,
num_or_size_splits: BatchSize);
var trainValueBatches = tf.split(
trainValues,
num_or_size_splits: BatchSize);
然后将trainBaches
和trainValueBatches
传递给fit
,但是我似乎无法弄清楚必须为其他参数传递什么。似乎fit
不喜欢Tensor
对象的数组。
TensorFlow 1.12