我有一个只有二进制值的熊猫系列
0
0 1
1 0
2 0
3 0
4 1
5 0
6 1
7 0
8 0
9 1
10 0
11 1
12 0
13 1
14 0
我想隐式地隐式地将该序列的值设为零,并且在其附近具有一个值,即基本上将1,0,1更改为1,1,1,1。
我需要的输出是:
0 1
1 0
2 0
3 0
4 1
5 1
6 1
7 0
8 0
9 1
10 1
11 1
12 1
13 1
14 0
我在这里尝试的是创建一个3的滚动窗口,并检查值是否是我所需要的。有没有更好的方法可以解决这个问题?
>>> window = df.rolling(3, center=True)
>>> (df[0] | window.apply(lambda x: 1 if (x == [1,0,1]).all() else 0)[0].fillna(0)).astype(int)
注意:我也尝试过移位功能。
答案 0 :(得分:3)
将shift
用于布尔掩码,并通过numpy.where
设置1
:
m1 = df[0].shift() == 1
m2 = df[0].shift(-1) == 1
m3 = df[0] == 0
df[0] = np.where(m1 & m2 & m3, 1, df[0])
print (df)
0
0 1
1 0
2 0
3 0
4 1
5 1
6 1
7 0
8 0
9 1
10 1
11 1
12 1
13 1
14 0
答案 1 :(得分:2)
您可以使用rolling
执行长度为3的居中移动窗口,然后检查0
列的值是否为0,同时检查sum
的值。该索引处的居中移动窗口为2,表示周围的样本为1s:
df['window'] = df.rolling(3, center = True).sum()
idx = df[(df.window == 2.0) & (df['0'] == 0)].index.values
df.loc[idx,'0'] = 1
print(df['0'])
0 1
1 0
2 0
3 0
4 1
5 1
6 1
7 0
8 0
9 1
10 1
11 1
12 1
13 1
14 0
答案 2 :(得分:1)
您也可以针对特定情况使用卷积。
您可以使用以下过滤器:
[0.5, 0, 0.5]
仅当周围位置是您所在的位置时,您才能获得该位置的。
然后您可以将其用作索引,将系列的值更改为1。
from scipy.signal import convolve
print(df)
0 1
1 0
2 0
3 0
4 1
5 0
6 1
7 0
8 0
9 1
10 0
11 1
12 0
13 1
14 0
dtype: int64
df.iloc[convolve(df, [0.5, 0, 0.5], mode='same') == 1] = 1
print(df)
0 1
1 0
2 0
3 0
4 1
5 1
6 1
7 0
8 0
9 1
10 1
11 1
12 1
13 1
14 0
做了一点时间检查:
def check_convolve(df):
df.iloc[convolve(df, [0.5, 0, 0.5], mode='same') == 1] = 1
def check_shifts(df):
m1 = df.shift() == 1
m2 = df.shift(-1) == 1
m3 = df == 0
df = np.where(m1 & m2 & m3, 1, df[0])
%timeit check_convolve(df)
205 µs ± 22.5 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)
%timeit check_shifts(df)
1.16 ms ± 37.4 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)