Question

我想删除重复的单元格，因为它们指出了子元素。例如，我有一个这样的df：

|   | Customer ID | Category      | VALUE   |
| -:|:----------- |:------------- | -------:|
| 0 | HETO90      | Baby Sets     |  1000.0 |
| 1 | HETO90      | Girls Dresses |  5356.0 |
| 2 | HETO90      | Girls Jumpers |  2822.0 |
| 3 | HETO90      | Girls Top     | 13398.0 |
| 4 | HETO90      | Shorts        |  7590.0 |

我只想将HET090合并到一个。像这样：

|   | Customer ID | Category      | VALUE   |
| -:|:----------- |:------------- | -------:|
| 0 |             | Baby Sets     |  1000.0 |
| 1 |             | Girls Dresses |  5356.0 |
| 2 | HETO90      | Girls Jumpers |  2822.0 |
| 3 |             | Girls Top     | 13398.0 |
| 4 |             | Shorts        |  7590.0 |

Answer 1

在pandas中，最里面的索引必须标记每一行。

df = df.set_index('Customer ID', append=True).swaplevel(0,1)

输出：

                    Category    VALUE
Customer ID                          
HETO90      0      Baby Sets   1000.0
            1  Girls Dresses   5356.0
            2  Girls Jumpers   2822.0
            3      Girls Top  13398.0
            4         Shorts   7590.0

使用pandas

1 个答案: