如何在python中解析这个正则表达式?
这里我需要在“From”和“date time stamp”之间解析字符串“ Miracle workers ” 以有效的方式。
s = """
business hours. Keyword Search: Sales, Operations, Director, Medical, Medical Devices, DME, Respiratory Equipment, Sales Rep, Account Executive, Exec, Business... <br />
From Miracle Workers - 26 Apr 2012 08:45:15 GMT
- View all <a href="http://www.indeed.com/l-Houston,-TX-jobs.html">Houston jobs</a>
"""
这是正在进行的正则表达式。我需要获得高效的正则表达式。
regex1 = re.findall('From\ ([A-Za-z\ ]+)\-',s)
['Miracle Workers ']
从网址中提取另一个字符串。
s2 = http://www.indeed.com/job/Region-Manager-Field-Sales-at-Covidien-in-Atlanta,-GA-a1a421aabb4d54a7"
regex2 = re.findall('-in-([A-Za-z-]+),-([A-Z]{2})',str(job.url))[0]
在这里,我得到两个元组,如('亚特兰大','GA'),而不是需要得到“亚特兰大,GA”
如何在所有情况下以有效的方式获得结果?
答案 0 :(得分:1)
使用()你的分组结果,这样,findall给你一个元组。试试这个正则表达式(不分组):
regexp = '-in-[A-Za-z-]+,-[A-Z]{2}'