应用错误收集

在Python中使用Beautifulsoup进行网络爬取

时间：2018-09-30 14:01:29

标签： python web web-scraping beautifulsoup

我是Python的Beautifulsoup包的新手，使用.findAll（）函数时得到了一些意外的结果。我需要立即从此网页的浅蓝色突出显示部分中提取/ File /右侧的字符串：

这是我的Beautifulsoup / Python代码：

代码的前两行工作正常，但是pdf1为空。谁能阐明为什么.findAll（）函数找不到此标记（我假设我在语法错误，只是不确定在哪里）？

1 个答案:

答案 0 :(得分：0)

您的屏幕截图显示了我猜当前HTML的浏览器输出？您是否检查过page.text中的内容是否相同？如ngRepeat所示，这可能会揭示BS无法处理的任何客户端修改。