标签: python pandas
我有一个pandas数据框df1,其中包含一系列时间测量值(样本n上的实验x的持续时间y;以秒为单位)。
df1
n
x
y
理论上,每个持续时间n是系列中最短持续时间的整数倍。请注意,不同样本的最短持续时间会有所不同。
实际上,时间测量仅是近似值。当根据长度(以秒为单位)对持续时间进行排序并绘制结果时,我会得到类似的结果:
我想打开一个新列并为每个测量分配一个整数。如何确定上图中的高原1-3?
我对可扩展的解决方案感兴趣,因此不能除以系列中最小的数字,因为我将来会面对数千个样本。