我正在尝试更改切片中除第一个值之外的所有值,但是它不起作用...我在做什么错了?
print(test)
test.loc[(test.col_1==-5)&(test.index>'2018-07-17 13:00:00')&(test.index<'2018-07-17 14:00:00'),['col_1']][1:]=-1
print(test)
提供以下输出
17/07/2018 13:51:00 -5
17/07/2018 13:52:00 -1
17/07/2018 13:53:00 -5
17/07/2018 13:54:00 -5
17/07/2018 13:55:00 -5
17/07/2018 13:56:00 -5
17/07/2018 13:57:00 -5
17/07/2018 13:58:00 -5
17/07/2018 13:59:00 -5
17/07/2018 13:51:00 -5
17/07/2018 13:52:00 -1
17/07/2018 13:53:00 -5
17/07/2018 13:54:00 -5
17/07/2018 13:55:00 -5
17/07/2018 13:56:00 -5
17/07/2018 13:57:00 -5
17/07/2018 13:58:00 -5
17/07/2018 13:59:00 -5
而我期望第二个输出是
17/07/2018 13:51:00 -5
17/07/2018 13:52:00 -1
17/07/2018 13:53:00 -1
17/07/2018 13:54:00 -1
17/07/2018 13:55:00 -1
17/07/2018 13:56:00 -1
17/07/2018 13:57:00 -1
17/07/2018 13:58:00 -1
17/07/2018 13:59:00 -1
答案 0 :(得分:1)
您可以使用numpy.where
并使用索引[1:]
来排除标准首次为True
的时间。这是一个最小的示例:
df = pd.DataFrame([[1, -5], [2, -5], [3, -1], [4, -5], [5, -5], [6, -1]],
columns=['col1', 'col2'])
df.iloc[np.where(df['col1'].between(2, 5))[0][1:], 1] = -1
print(df)
col1 col2
0 1 -5
1 2 -5
2 3 -1
3 4 -1
4 5 -1
5 6 -1
答案 1 :(得分:0)
选择时存在连接布尔索引(过滤)的问题,一种可能的解决方案是添加新条件:
test.index = pd.to_datetime(test.index)
mask = (test.col_1==-5)&(test.index>'2018-07-17 13:00:00')&(test.index<'2018-07-17 14:00:00')
m1 = np.arange(len(test)) > 1
test.loc[mask & m1, 'col_1']=-1
print (test)
col_1
2018-07-17 13:51:00 -5
2018-07-17 13:52:00 -1
2018-07-17 13:53:00 -1
2018-07-17 13:54:00 -1
2018-07-17 13:55:00 -1
2018-07-17 13:56:00 -1
2018-07-17 13:57:00 -1
2018-07-17 13:58:00 -1
2018-07-17 13:59:00 -1