我需要找到来自零售连锁网络的数据分布(所有商店的产品需求)。我尝试使用EasyFit(它有82个分布来检查最佳分布)来适应分布,但没有适合数据的分布。可以做些什么?有没有办法找到数据分布是多个分布的总和还是卷积?我已从数据集中删除了峰值或季节性或促销数据,但仍然没有适合分发。
答案 0 :(得分:0)
这取决于你的意思是“没有分配适合数据”。通过对分布进行排名(使用Kolmogorov-Smirnov,Anderson Darling,卡方或其他测试统计数据),您可以获得最佳拟合。你不会得到一个完美的契合,因为分布是理论的,你最合适的工作,或根本不使用它。发布一些数据,以及最适合的测试统计数据,或详细说明问题。有时您只需要接受数据构造不良,或者分析数据没有意义。
如果问题纯属统计性质,那么最好将其发布在https://stats.stackexchange.com/上。
答案 1 :(得分:0)
您是否尝试过转换数据?模拟多个变换,并采用适合统计推断的分布的最佳近似。