我正在尝试测试周期性数据集对于与周期折叠的相同数据集(即平均配置文件)的行为方式。更具体地说,我想测试单个配置文件是否与平均配置文件一致。
我正在阅读Python中的一些测试,特别是关于the Kolmogorov-Smirnov statistic on 2 samples和chi square test。
但是,我的数据是真实数据,当然也是分档。
因此,由于频繁发生,我的数据之间存在差距。这意味着单个配置文件中的箱柜数量通常小于"型号的箱柜数量。 (折叠/平均轮廓)。
这意味着我无法直接使用这些测试(因为这两个数组的元素数量不同),但我可能需要:
1)做一些允许我比较分布的转换或任何其他操作;
2)此外,将平均轮廓转换为连续模型将是一个很好的解决方案;
3)继续使用我不知道的不同统计工具。
但我不知道如何继续前进,所以我需要帮助找到(1)或(2)(也许两者都有!)的方法,或者对第三种情况的暗示。
编辑:数据是光线曲线,即光子计数与时间的关系。 数据来自周期性天文源,即每个给定时期重复其模式(轮廓)。我可以使用句点折叠数据并获得平均配置文件,并且我想使用此平均配置文件作为模型来测试每个单个配置文件与平均配置文件,即我的模型。 谢谢!