Question

如何在python中解析这个正则表达式？

这里我需要在“From”和“date time stamp”之间解析字符串“ Miracle workers ” 以有效的方式。

    s = """
      business hours. Keyword Search: Sales, Operations, Director, Medical, Medical Devices, DME, Respiratory Equipment, Sales Rep, Account Executive, Exec, Business... <br />
             From Miracle Workers - 26 Apr 2012 08:45:15 GMT
          -  View all <a href="http://www.indeed.com/l-Houston,-TX-jobs.html">Houston    jobs</a>
    """

这是正在进行的正则表达式。我需要获得高效的正则表达式。

    regex1 = re.findall('From\ ([A-Za-z\ ]+)\-',s)
     ['Miracle Workers ']

从网址中提取另一个字符串。

  s2 = http://www.indeed.com/job/Region-Manager-Field-Sales-at-Covidien-in-Atlanta,-GA-a1a421aabb4d54a7"
  regex2 = re.findall('-in-([A-Za-z-]+),-([A-Z]{2})',str(job.url))[0]

在这里，我得到两个元组，如（'亚特兰大'，'GA'），而不是需要得到“亚特兰大，GA”

如何在所有情况下以有效的方式获得结果？

Answer 1

使用（）你的分组结果，这样，findall给你一个元组。试试这个正则表达式（不分组）：

regexp = '-in-[A-Za-z-]+,-[A-Z]{2}'

python中的正则表达式字符串检索

1 个答案: