我有一个数据框,我想提取模式的所有出现,然后将它们作为单个字符串连接成为我原始数据帧的新列。
示例:
original = pd.DataFrame(["bonjour bonjour", "au revoir bonjour", "lala"])
0
0 bonjour bonjour
1 au revoir bonjour
2 lala
预期结果:
0 1
0 bonjour bonjour bonjour, bonjour
1 au revoir bonjour bonjour
2 lala
我被困的地方:
extracted = original[0].str.extractall("(bonjour)")
0
match
0 0 bonjour
1 bonjour
1 0 bonjour
我无法管理这个结果,我真的不知道如何处理这个结构。看起来很简单但是,根据我访问它的方式,我不能得到我想要的东西。
答案 0 :(得分:4)
您需要使用UniqueUsers YEAR MONTH MONTH2
NULL NULL January 1
NULL NULL February 2
NULL NULL July 7
NULL NULL August 8
NULL NULL September 9
NULL NULL October 10
NULL NULL November 11
NULL NULL December 12
1 2016 March 3
2 2016 April 4
2 2016 May 5
1 2016 June 6
而不是全部提取
Nov Dec Jan Feb Mar Apr May Jun Jul Aug Sep Oct