从scikit-learn主页的example我了解到使用TimeSeriesSplit的工作流在伪代码中看起来像这样:
large_train, large_test = split_whole_dataset(df)
for epoch in epochs:
for train, validate in tscv.split(large_train):
params = standardize(train)
standarize(validate, using=params)
evaluate_model_using_data(large_test) #<--- How to standardize this data????
让我困惑的是两件事: 首先,我会在每个时代测试的相同数据上训练模型吗?所以当我做第二个时代时,我会在所有验证数据上训练模型吗?
第二件事,我使用什么值来标准化保持测试数据(large_test),因为我在内部循环中重复标准化我不知道在标准化测试数据时使用哪些参数?