使用pandas

时间:2017-12-06 22:33:04

标签: python pandas

我想删除重复的单元格,因为它们指出了子元素。 例如,我有一个这样的df:

|   | Customer ID | Category      | VALUE   |
| -:|:----------- |:------------- | -------:|
| 0 | HETO90      | Baby Sets     |  1000.0 |
| 1 | HETO90      | Girls Dresses |  5356.0 |
| 2 | HETO90      | Girls Jumpers |  2822.0 |
| 3 | HETO90      | Girls Top     | 13398.0 |
| 4 | HETO90      | Shorts        |  7590.0 |

我只想将HET090合并到一个。像这样:

|   | Customer ID | Category      | VALUE   |
| -:|:----------- |:------------- | -------:|
| 0 |             | Baby Sets     |  1000.0 |
| 1 |             | Girls Dresses |  5356.0 |
| 2 | HETO90      | Girls Jumpers |  2822.0 |
| 3 |             | Girls Top     | 13398.0 |
| 4 |             | Shorts        |  7590.0 |

1 个答案:

答案 0 :(得分:2)

在pandas中,最里面的索引必须标记每一行。

df = df.set_index('Customer ID', append=True).swaplevel(0,1)

输出:

                    Category    VALUE
Customer ID                          
HETO90      0      Baby Sets   1000.0
            1  Girls Dresses   5356.0
            2  Girls Jumpers   2822.0
            3      Girls Top  13398.0
            4         Shorts   7590.0