我正在处理相当多的语音信号,这些信号是手动预分段的。然而,分段根本不精确,因此在开始和结束时总是存在一些恼人的片段。以下是一个例子。
0 13.806404
1 13.681412
2 14.056404
3 NaN
4 15.025136
5 15.072026
6 15.072026
7 NaN
8 NaN
9 NaN
10 NaN
11 NaN
12 NaN
13 NaN
14 NaN
15 NaN
16 NaN
17 NaN
18 17.712722
19 17.993896
20 18.040795
21 18.056421
22 18.087629
23 18.165769
24 18.212630
25 18.228282
26 18.243920
27 18.243920
28 18.243920
29 18.228282
30 18.212630
31 18.197084
32 18.150182
33 18.103274
34 18.197084
35 NaN
36 18.540826
37 18.712610
38 18.884508
39 18.868914
40 NaN
41 18.806456
42 18.743890
43 NaN
44 18.728286
45 18.743890
46 18.790792
47 NaN
48 NaN
49 NaN
50 NaN
51 NaN
52 27.053239
53 25.976291
dtype: float64
我正在寻找一种有效的方法来删除上面示例列表中第6个元素之前和第52个元素之后的片段。
请注意,这些元素可能不是统计异常值,我将其视为,但性能不佳......
非常感谢!
答案 0 :(得分:0)
你可以保留第6行和第52行
df.ix[6:52]
ix将根据您的索引保持第6到第52行。