真正的努力试图解析一张桌子

时间:2017-07-13 18:59:29

标签: python web-scraping beautifulsoup bs4 html5lib

我正在尝试从网络上解析一张桌子(价格)并且它正在变成一场真正的斗争

这是网络

url='http://www.zonebourse.com/AEX-7959/composition/'

使用bs4:

r = requests.get(url)
data = r.text
soup = BeautifulSoup(data,"html5lib")
tables =soup.find('table',id='ALNI4')

print tables

使用html5lib:

df=pd.read_html(url)
print df

在这两种情况下都没有找到表格,任何人都可以帮我解析表格或至少了解问题是什么?

ValueError: No tables found

如果可能的话,我想放弃xml的选项,因为安装有问题所以根本不使用。

提前谢谢

2 个答案:

答案 0 :(得分:1)

似乎你在寻找

url='http://www.zonebourse.com/AEX-7959/composition%E2%80%8C%E2%80%8B/'

答案 1 :(得分:1)

由于某种原因,您指向的URL是错误的。我搜索了URL的实际内容,实际上是http://www.zonebourse.com/AEX-7959/composition%E2%80%8C%E2%80%8B/

我不知道为什么这个网址很奇怪。

如果您进行了编辑,(url='http://www.zonebourse.com/AEX-7959/composition%E2%80%8C%E2%80%8B/')您的代码应该正常工作(虽然我自己没有测试过!)

希望它有所帮助! Bonne chance!