BeautifulSoup没有解析过去的标题标签

时间:2014-10-15 13:42:30

标签: python beautifulsoup

我正在尝试解析页面

http://gwyneddathletics.com/custompages/sport/mlacrosse/stats/2014/ml0402gm.htm

当我尝试findAll('b')时,我没有得到任何结果,与'tr'相同。除了最初的标题标签,我找不到任何东西。

另外,当我做汤= BeautifulSoup(标记)并打印汤时,我会在输出结束时获得额外的整个页面

我正在使用带有BeautifulSoup 3.2.0的python 2.6。为什么我的汤没有正确解析页面?

1 个答案:

答案 0 :(得分:0)

很可能BeautifulSoup使用的解析器真的不喜欢页面上的标记,我过去也遇到过类似的问题。我对你的输入进行了快速测试,发现如果你升级到最新的BeautifulSoup(该软件包叫做bs4),那么就可以了。 bs4也支持python2.6,它与BeautifulSoup(3.x系列)之间的向后不兼容的变化很小。如果您需要查看如何移植,请参阅here