Z评分连续归一化r数据帧

时间:2018-07-02 02:51:47

标签: r dataframe normalize

我想通过使用函数data.frame计算z得分来归一化R scale()

但是,我不确定这种方法是否受“前瞻性偏差”的约束,这是一个财务术语,用于弥补在分析期间不知道或不可用的功能。

这些是股票收益,我想将此数据用于“回测”(用于验证的财务术语)。我想确保在计算z分数时,每个周期的z分数仅使用到该点为止的可用数据,而不是整个序列的均值和标准差。

有人知道如何执行此计算吗?还是有其他方法?

1 个答案:

答案 0 :(得分:0)

您可以使用标准化对数据进行标准化或创建新功能,而不必担心“前瞻性”偏差。这很常见。

您只是不使用任何数据,因此在分析期间将无法使用。

与目标编码或其他特征工程技术非常相似,您只需在历史数据的训练子集上创建这些特征,然后在验证拆分中对其进行验证。您还可以考虑使用KFold交叉验证。

如果您想通过一个可重复的示例来扩大您的问题,我可以向您展示。