因此,对于某些网站页面,它似乎是打印出奇怪的符号而不是html代码。
import requests
import html5lib
from bs4 import BeautifulSoup
r = requests.get('http://i.imgur.com/K6ihil4.jpg')
soup = BeautifulSoup(r.content, "html5lib")
print(soup)
结果
|-Ç× Éžö�re‹+Ñ^qÐÂ;Éïùøc#»ÈîÜwpÆŒr╔°\ˆl╚¤Å°›║‰q></ps¥4"bí4*�r�═…k‚¢i�€èÀˆ!©ji†Êhz║…&╚`ab7a)a></o�èöóÖã|oÆø=5¸¿║
|-נɞre+^q;c#wpƌr╔\l╚Ű║q></m%x܌]o6<'═fn'╝^jt></o|o=5║ ñ~╚co></r
y||�k“s'ät=^></x6,¯ekjß¡+•‡u?═}ÕkÐÞº“></h7=></body></~╚co></ry||ks't=^></g0Ü╔&+yz></g></x6,ekjߡ+u?═}k></p|╔}═u|></h7=></
body></html>