如果数据低于熊猫数据框中的阈值,则获取布尔值

时间:2019-07-08 16:21:40

标签: python pandas dataframe

我有一个带有电压和电流值的熊猫多指标数据框:

数据框:

a b 'name' unit
             0    1    2    3   ... 
1 1  absd A  0  1.1  3.6  7.6
          V  6   66  103  202
  2  quat A  1  2.5 14.9  nan
          V  0    3   66  nan

我想转换数据框,以便为每个键获取一个布尔值:

对于任意给定的电压和电流(例如60V和10A),我检查数据帧中最接近的电压值,然后检查相应的电流是大于还是小于给定的电流。 对于示例,最后应该看起来像这样:

a b 'name'
1 1  absd  0          
  2  quat  1

有了一些for循环,我可以运行它,但是有没有一种很好而有效的方法可以对pandas执行此操作,从而避免了for循环和其他迭代方法?

2 个答案:

答案 0 :(得分:1)

这是我使用groupbyidxmin的方法:

df = df.stack().unstack('unit')

# function for each v and a
def get_thresh(df, v, a):
    v_diff = (df['V'] - v).abs()
    idx = v_diff.groupby(['a','b','name']).idxmin()

    return (df.loc[idx,'A']
              .gt(a).astype(int)
              .reset_index(level=-1, drop=True)
           )

get_thresh(df, 60,10)

返回:

a  b  name   
1  1  absd    0
   2  quat    1
Name: A, dtype: int32

答案 1 :(得分:0)

您可以使用pd.IndexSlice分别选择数据帧的V和A,然后创建布尔掩码以查看A的值是否大于10,而V的值最接近60。

amp_min = 10
volt_value = 60

# mask for A
mask_A = (df.loc[pd.IndexSlice[:,:,:, 'A'], :] > amp_min).reset_index(level=-1, drop=True)

#mask for V by finding the column position of the minimum difference
mask_V = pd.get_dummies((df.loc[pd.IndexSlice[:,:,:, 'V'], :] - volt_value)
                           .abs().idxmin(axis=1)).reset_index(level=-1, drop=True)

#combine both mask and use any per row
print ((mask_A & mask_V).any(1).astype(int))
a  b  name
1  1  absd    0
   2  quat    1
dtype: int32