如何用值满足条件的列名填充pandas数据框中的列?

时间:2019-08-19 15:12:33

标签: python pandas

我需要在数据框中填充一个满足指定条件的列名称的新列。在此示例中为> 1

我尝试遍历有问题的列(它是df.columns的子集),但是没有提供所需的输出。

df = pd.DataFrame([
    [1, 0, 2, 2],
    [1, 1, 0, 0],
    [0, 2, 3, 2],
    [2, 2, 1, 1]],
  columns=['col1', 'col2', 'col3', 'col4'])
cols = df.columns[:-1]
df['d'] = ''
for col in cols:
    df.loc[df[col] > 1, 'd'] = col

当前输出:

out = pd.DataFrame([
    [1, 0, 2, 2, 'col3'],
    [1, 1, 0, 0, ''],
    [0, 2, 3, 2, 'col3'],
    [2, 2, 1, 1, 'col2']],
    columns=['col1', 'col2', 'col3', 'col4', 'd'])

我需要的是有关满足该条件的所有列的信息,因此输出如下:

out = pd.DataFrame([
    [1, 0, 2, 2, 'col3'],
    [1, 1, 0, 0, ''],
    [0, 2, 3, 2, 'col2,col3'],
    [2, 2, 1, 1, 'col1,col2']],
    columns=['col1', 'col2', 'col3', 'col4', 'd'])

任何帮助将不胜感激。

2 个答案:

答案 0 :(得分:4)

 df['d'] = (df.iloc[:,:-1] > 1).apply(lambda x: ','.join([col for cond,col in zip(x,df.columns) if cond]), axis=1)

结果:

   col1  col2  col3  col4          d
0     1     0     2     2       col3
1     1     1     0     0           
2     0     2     3     2  col2,col3
3     2     2     1     1  col1,col2

答案 1 :(得分:2)

尝试以下代码段。

<bit>

输出:

template<class T>
  constexpr T log2p1(T x) noexcept;