我有以下格式的数据框
Time Current
1535628998 0.336701
1535628998 0.318786
1535628998 0.327593
1535628998 0.347806
1535628998 0.345533
...... around 600 rows in between
1535628999 0.286297
1535628999 0.359201
1535628999 0.328524
1535628999 0.264149
..................
1535629000 0.292071
1535629000 0.394397
1535629000 0.321624
1535629000 0.309555
1535629000 0
.368269
........
我想通过跳过同一“时间”中的其余行来获得每个“时间”中的每100行。
有解决方案吗?
答案 0 :(得分:0)
我认为您需要
df.groupby('Time').head(100)
MVCE:
df = pd.DataFrame({'Time':[1]*10+[2]*10,'data':np.arange(20)})
df.groupby('Time').head(5)
输出:
Time data
0 1 0
1 1 1
2 1 2
3 1 3
4 1 4
10 2 10
11 2 11
12 2 12
13 2 13
14 2 14