IndexError:列表索引超出范围

时间:2017-03-12 13:09:56

标签: html python-2.7

我有一个数据列表,我从使用正则表达式拆分html。

data_list = re.findall(r'<tr.*?>(.*?)<\/tr>', html)

当我在data_list中循环时,我想将变量open定义为例如

open = re.findall(r'kurs".*?>(.*?)<\/td', x)[0].strip('</span>')

它给了我一个错误:

  

追踪(最近一次呼叫最后一次):

     

文件&#34;&#34;,第2行,in       open = re.findall(r&#39; kurs&#34;。?&gt;(。?)&lt; / td&#39;,x)[0] .strip(&#39;& #39)

     

IndexError:列表索引超出范围

提前谢谢

1 个答案:

答案 0 :(得分:0)

此错误表示列表中不存在具有此类索引的元素。因此re.findall列表中没有第一个元素返回,这意味着它什么都没找到。

顺便说一下,不建议使用正则表达式来解析HTML,更好地使用像BeautifulSoup和lxml这样的面向HTML的框架。