允许空格和句点的Python scraper正则表达式

时间:2012-06-13 22:24:19

标签: python regex

我正在尝试使用允许空格和句点的正则表达式来编写python scraper。

我正在尝试从某个网站获取棒球队名称,因此有些是Miami(完整的单词),但其他人是San Francisco(有空格)而其他人是Chi. Cubs(期间和空间)。

我知道城市名称前面的模式,我知道之后的模式名称,我试图找到一些东西,只是匹配之间的所有内容,无论字符数或空格或句点数。我更喜欢使用正则表达式,但如果它更容易使用不同的库,我会对它开放。

1 个答案:

答案 0 :(得分:2)

这是一个匹配任意数量的空格,句号或字母的正则表达式:

[ .a-zA-Z]+

示例:

>>> re.search(r'[ .a-zA-Z]+', 'Miami').group(0)
'Miami'
>>> re.search(r'[ .a-zA-Z]+', 'San Francisco').group(0)
'San Francisco'
>>> re.search(r'[ .a-zA-Z]+', 'Chi. Cubs').group(0)
'Chi. Cubs'