标签: r algorithm prediction
我是预测新手,我看到的只是训练数据集和测试数据集。但实际上,预测模型或算法如何在实时环境中运行。我们在现实世界中有数百万的观察。那我们该怎么做呢。我们是在样本数据上还是在数百万行上运行模型。
此外,在训练集上进行的任何更改都是在测试集上完成的。这意味着,如果对训练集中的缺失值或异常值进行了任何更改,那么是否也要在测试集上进行复制?
请帮助。