在Python中使用Beautifulsoup进行网络爬取

时间:2018-09-30 14:01:29

标签: python web web-scraping beautifulsoup

我是Python的Beautifulsoup包的新手,使用.findAll()函数时得到了一些意外的结果。我需要立即从此网页的浅蓝色突出显示部分中提取/ File /右侧的字符串:

enter image description here

这是我的Beautifulsoup / Python代码:

enter image description here

代码的前两行工作正常,但是pdf1为空。谁能阐明为什么.findAll()函数找不到此标记(我假设我在语法错误,只是不确定在哪里)?

1 个答案:

答案 0 :(得分:0)

您的屏幕截图显示了我猜当前HTML的浏览器输出?您是否检查过page.text中的内容是否相同?如ngRepeat所示,这可能会揭示BS无法处理的任何客户端修改。