数据框中列的所有可能组合,具体取决于另一列中的值

时间:2018-05-14 15:25:18

标签: pandas dataframe combinations

我的df看起来像这样:

sent  token  token2
1     word1  word1
1     word2  word2
1     word3  word3
1     word4  word4
1     word5  word5
2     word6  word6

现在我想在列表中获得所有可能的令牌组合,如果它们具有sent的相同值。输出应该如下所示:

[1, word1, word2, n]
[1, word1, word3, n]
[1, word1, word4, n]
[1, word1, word5, n]
[1, word2, word3, n]
...

我尝试使用itertoolscrosstab构造,但我似乎无法弄清楚如何为它们添加条件。

1 个答案:

答案 0 :(得分:1)

您可以在此处使用flex,然后对值进行排序,使用删除重复的值 mergenp.sort

drop_duplicates