python中的正则表达式字符串检索

时间:2012-04-27 14:05:08

标签: python regex string

如何在python中解析这个正则表达式?

这里我需要在“From”和“date time stamp”之间解析字符串“ Miracle workers ” 以有效的方式。

    s = """
      business hours. Keyword Search: Sales, Operations, Director, Medical, Medical Devices, DME, Respiratory Equipment, Sales Rep, Account Executive, Exec, Business... <br />
             From Miracle Workers - 26 Apr 2012 08:45:15 GMT
          -  View all <a href="http://www.indeed.com/l-Houston,-TX-jobs.html">Houston    jobs</a>
    """

这是正在进行的正则表达式。我需要获得高效的正则表达式。

    regex1 = re.findall('From\ ([A-Za-z\ ]+)\-',s)
     ['Miracle Workers ']

从网址中提取另一个字符串。

  s2 = http://www.indeed.com/job/Region-Manager-Field-Sales-at-Covidien-in-Atlanta,-GA-a1a421aabb4d54a7"
  regex2 = re.findall('-in-([A-Za-z-]+),-([A-Z]{2})',str(job.url))[0]

在这里,我得到两个元组,如('亚特兰大','GA'),而不是需要得到“亚特兰大,GA”

如何在所有情况下以有效的方式获得结果?

1 个答案:

答案 0 :(得分:1)

使用()你的分组结果,这样,findall给你一个元组。试试这个正则表达式(不分组):

regexp = '-in-[A-Za-z-]+,-[A-Z]{2}'