我对一个奇怪的数据集有一个奇怪的问题。 基本上我有一个模型的25个重复,他们都有火的大小和火的大小累计相加。
所以数据的简短摘要将是例子:
fires_size rep cumsum
0 1 rep_9 1
1 1 rep_9 2
2 1 rep_9 3
....
50 59 rep_9 4000
51 75 rep_9 4075
....
150 1 rep_20 1
151 1 rep_20 2
152 1 rep_20 3
....
200 12 rep_20 3500
201 70 rep_20 3570
所以当我绘制这个pandas数据帧时,火焰大小为x,累积区域为y:我得到类似的东西(蓝线,因为我有两个不同的数据集)。
Image there as I can't upload picture
所以现在一个很酷的事情是能够创建一个平均复制品,可以在我的其他代表之上绘制,以显示平均分布,更好的是能够计算标准偏差并使用填充之间的差异表现得更好。
我的问题是,由于我的火力大小(x轴)不一致(多个因为y是累积的),我不知道如何做到这一点。我尝试了一些趋势线,尝试了类似的东西,但它从来没有给我一个非常好的结果。
那么有一种简单的方法吗?我在这里缺乏一些基本的统计知识!由于我甚至不知道如何描述我的数据集,因此无法找到我可以理解的任何答案。
非常感谢你!
我会在评论中发布完整数据的链接,因为我无法发布多个链接