熊猫分组每行多个组

时间:2019-08-15 16:37:29

标签: python pandas

作为对我的问题on multicriteria groupings in pandas的跟进,如果一行可以属于多个组,您将如何对行进行分组?

例如,如果我们有

| index | address     | first_name | last_name |
|  1    | 1800 St.    | John       | Adams     |
|  2    | 1800 Street | Juno       | A.        |
|  3    | Elm St.     | Junhui     | Wen       |
|  4    | NaN         | Jun        | W         |

然后

  • 记录1和2应该分组在一起(地址中3个字符)
  • 记录2、3和4应该在另一个组中分组在一起(名字中相同的3个字符)

1 个答案:

答案 0 :(得分:0)

对于第一种情况,您可以执行以下操作:

df.groupby(lambda d: d.address.str.slice(0,3))

在第二种情况下相同,但具有适当的列:

df.groupby(lambda d: d.first_name.str.slice(0,3))

让我知道它是否有效:D