我的代码需要帮助。
现在,下面的代码适用于字符串。
我要实现的是能够执行相同的过程,但要处理整个数据框列,其中包含关于公寓的描述(df ['description'])。
正则表达式查找“ ROOMS”,并将空格和单词放在比赛之前。
我想我可以使用 for 函数来实现此目的,但我不知道该怎么做。
预期的Out应该将分组并与正则表达式中我df的 description 列的每一行匹配。
感谢您的帮助!
In: mystring = 'VERY BIG 2 ROOMS APARTMENT'
mystring
Out: 'VERY BIG 2 ROOMS APARTMENT'
In:regex = r"\w+(?=\s(ROOMS)\b)"
matches = re.finditer(regex, mystring)
In:for m in re.finditer(r"\w+(?=\s(ROOMS)\b)", mystring):
print((m.group(0)+' '+m.group(1)))
Out: 2 ROOMS