整个数据框列的正则表达式

时间:2018-08-13 17:44:03

标签: regex python-3.x dataframe

我的代码需要帮助。

现在,下面的代码适用于字符串。

我要实现的是能够执行相同的过程,但要处理整个数据框列,其中包含关于公寓的描述(df ['description'])。

正则表达式查找“​​ ROOMS”,并将空格和单词放在比赛之前。

我想我可以使用 for 函数来实现此目的,但我不知道该怎么做。

预期的Out应该将分组并与正则表达式中我df的 description 列的每一行匹配。

感谢您的帮助!


In: mystring = 'VERY BIG 2 ROOMS APARTMENT'
mystring

Out: 'VERY BIG 2 ROOMS APARTMENT'

In:regex = r"\w+(?=\s(ROOMS)\b)"

matches = re.finditer(regex, mystring)

In:for m in re.finditer(r"\w+(?=\s(ROOMS)\b)", mystring): 
    print((m.group(0)+' '+m.group(1)))

Out: 2 ROOMS

0 个答案:

没有答案