应用错误收集

时间：2018-07-02 02:51:47

标签： r dataframe normalize

我想通过使用函数data.frame计算z得分来归一化R scale()。

但是，我不确定这种方法是否受“前瞻性偏差”的约束，这是一个财务术语，用于弥补在分析期间不知道或不可用的功能。

这些是股票收益，我想将此数据用于“回测”（用于验证的财务术语）。我想确保在计算z分数时，每个周期的z分数仅使用到该点为止的可用数据，而不是整个序列的均值和标准差。

有人知道如何执行此计算吗？还是有其他方法？

答案 0 :(得分：0)

您可以使用标准化对数据进行标准化或创建新功能，而不必担心“前瞻性”偏差。这很常见。

您只是不使用任何数据，因此在分析期间将无法使用。

与目标编码或其他特征工程技术非常相似，您只需在历史数据的训练子集上创建这些特征，然后在验证拆分中对其进行验证。您还可以考虑使用KFold交叉验证。

如果您想通过一个可重复的示例来扩大您的问题，我可以向您展示。