应用错误收集

我相当擅长网页抓取并试图使用Beautifulsoup4和Python中的请求来废弃网站。该页面包含一个主图像和其他小的替代图像。

在通过浏览器检查所需的主img标记时，src属性是一个有效的url，但在通过python请求获取同一页面时，src属性作为base64字符串。像这样的东西

data:image/jpeg;base64,/9j/4AAQSkZJRgABAQAAAQABAAD/2wBDAAoHBwgHBgoICAgLCgoLDhgQDg0NDh0VFhEYIx8lJCIfIiEmKzcvJik0KSEiMEExNDk7Pj4+JS5ESUM8SDc9Pjv/2wBDAQoLCw4NDhwQEBw7KCIoOzs7Ozs7Ozs7Ozs7Ozs7Ozs7Ozs7Ozs7Ozs7Ozs7Ozs7Ozs7Ozs7Ozs7Ozs7Ozs7Ozv ...

所有其他替代图像的src属性都以正确的URL形式出现。问题仅出在主图像上。有没有办法在浏览器中显示实际的URL而不是这个base64字符串？

从img标记

0 个答案: