熊猫:加入来自extractall的结果

时间:2017-12-05 13:15:34

标签: python pandas

我有一个数据框,我想提取模式的所有出现,然后将它们作为单个字符串连接成为我原始数据帧的新列。

示例:

original = pd.DataFrame(["bonjour bonjour", "au revoir bonjour", "lala"])


                   0
0    bonjour bonjour
1  au revoir bonjour
2               lala

预期结果:

                   0                 1
0    bonjour bonjour  bonjour, bonjour
1  au revoir bonjour           bonjour
2               lala                  

我被困的地方:

extracted = original[0].str.extractall("(bonjour)")

               0
  match         
0 0      bonjour
  1      bonjour
1 0      bonjour

我无法管理这个结果,我真的不知道如何处理这个结构。看起来很简单但是,根据我访问它的方式,我不能得到我想要的东西。

1 个答案:

答案 0 :(得分:4)

您需要使用UniqueUsers YEAR MONTH MONTH2 NULL NULL January 1 NULL NULL February 2 NULL NULL July 7 NULL NULL August 8 NULL NULL September 9 NULL NULL October 10 NULL NULL November 11 NULL NULL December 12 1 2016 March 3 2 2016 April 4 2 2016 May 5 1 2016 June 6 而不是全部提取

Nov Dec Jan Feb Mar Apr May Jun Jul Aug Sep Oct