美丽的汤和要求没有得到整页

时间:2014-09-20 14:15:33

标签: python web-scraping beautifulsoup python-requests

我的代码看起来像这样。

from bs4 import BeautifulSoup
import requests

r  = requests.get("http://www.data.com.sg/iCurrentLaunch.jsp")
data = r.text
soup = BeautifulSoup(data)
n = soup.findAll('table')[7].findAll('table')
for tab in n:
    print tab.findAll('td')[1].text

我得到的是属性名称,直到IDYLLIC SUITES,之后我收到错误"列表索引超出范围"。问题是什么?

1 个答案:

答案 0 :(得分:1)

我不确定究竟是什么让你烦恼。因为当我尝试你的代码时(因为它)它对我有用。

仍然,尝试更改解析器,可能是html5lib

那样做,

pip install html5lib

然后将代码更改为

from bs4 import BeautifulSoup
import requests

r  = requests.get("http://www.data.com.sg/iCurrentLaunch.jsp")
data = r.text
soup = BeautifulSoup(data,'html5lib') # Change of Parser
n = soup.findAll('table')[7].findAll('table')
for tab in n:
    print tab.findAll('td')[1].text

如果有帮助请告诉我