从img标记

时间:2017-05-06 21:48:11

标签: python-3.x web-scraping

我相当擅长网页抓取并试图使用Beautifulsoup4和Python中的请求来废弃网站。该页面包含一个主图像和其他小的替代图像。

在通过浏览器检查所需的主img标记时,src属性是一个有效的url,但在通过python请求获取同一页面时,src属性作为base64字符串。像这样的东西

data:image/jpeg;base64,/9j/4AAQSkZJRgABAQAAAQABAAD/2wBDAAoHBwgHBgoICAgLCgoLDhgQDg0NDh0VFhEYIx8lJCIfIiEmKzcvJik0KSEiMEExNDk7Pj4+JS5ESUM8SDc9Pjv/2wBDAQoLCw4NDhwQEBw7KCIoOzs7Ozs7Ozs7Ozs7Ozs7Ozs7Ozs7Ozs7Ozs7Ozs7Ozs7Ozs7Ozs7Ozs7Ozs7Ozs7Ozv ...

所有其他替代图像的src属性都以正确的URL形式出现。问题仅出在主图像上。有没有办法在浏览器中显示实际的URL而不是这个base64字符串?

0 个答案:

没有答案