Python IndexError:没有这样的组

时间:2014-04-24 18:45:40

标签: python html regex

我今天早些时候开始学习Python,作为我的第一个项目,我想制作一个脚本,向我展示今天的天气预报。

我的剧本:

import urllib2, re

url = urllib2.urlopen('http://www.wetter.com/wetter_aktuell/wettervorhersage/heute     /deutschland/oberhausen/DE0007740.html')
html = url.read()
url.close()

x = re.search("""<dl><dd><strong>(?P<uhrzeit>.*)""", html, re.S)
x = re.search("""<dd><span class="degreespan" style="font-weight:normal;">(?P<temp>.*)""",  html, re.S)
print x.group('uhrzeit'), x.group('temp')

我使用this作为模板。当我运行此脚本时,我得到一个索引错误没有这样的组

1 个答案:

答案 0 :(得分:1)

您正在覆盖x

也许你想要:

x = re.search("""<dl><dd><strong>(?P<uhrzeit>.*)""", html, re.S)
y = re.search("""<dd><span class="degreespan" style="font-weight:normal;">(?P<temp>.*)""",  html, re.S)
print x.group('uhrzeit'), y.group('temp')

我无法相信您链接的网站主张使用正则表达式从HTML中提取信息。