对此数据帧存在一些麻烦,必须将具有相同名称的列的值减少为至少一个以“ 1”为“ 1”的值。
+---+---+---+---+---+---+---+---+---+
| a | a | a | b | c | c | c | d | d |
+---+---+---+---+---+---+---+---+---+
| 1 | 0 | 0 | 1 | 1 | 0 | 0 | 1 | 1 |
| 0 | 0 | 0 | 1 | 0 | 1 | 1 | 1 | 0 |
| 0 | 0 | 1 | 0 | 0 | 0 | 1 | 0 | 0 |
+---+---+---+---+---+---+---+---+---+
对于大型数据集的每一列使用“或”条件进行类似的操作可能是一项耗时的任务,因此我很难弄清楚。我用max(axis = 1,level = 0)还是没办法。
我想要的输出:
+---+---+---+---+
| a | b | c | d |
+---+---+---+---+
| 1 | 1 | 1 | 1 |
| 0 | 1 | 1 | 1 |
| 1 | 0 | 1 | 0 |
+---+---+---+---+
答案 0 :(得分:2)
使用max
df = df.max(level=0, axis=1)