我想通过使用函数data.frame
计算z得分来归一化R scale()
。
但是,我不确定这种方法是否受“前瞻性偏差”的约束,这是一个财务术语,用于弥补在分析期间不知道或不可用的功能。
这些是股票收益,我想将此数据用于“回测”(用于验证的财务术语)。我想确保在计算z分数时,每个周期的z分数仅使用到该点为止的可用数据,而不是整个序列的均值和标准差。
有人知道如何执行此计算吗?还是有其他方法?
答案 0 :(得分:0)
您可以使用标准化对数据进行标准化或创建新功能,而不必担心“前瞻性”偏差。这很常见。
您只是不使用任何数据,因此在分析期间将无法使用。
与目标编码或其他特征工程技术非常相似,您只需在历史数据的训练子集上创建这些特征,然后在验证拆分中对其进行验证。您还可以考虑使用KFold交叉验证。
如果您想通过一个可重复的示例来扩大您的问题,我可以向您展示。