我想从我的网站上读到该页面的描述。这是代码
import urllib.request
import re
req = urllib.request.Request("http://sorelogios.pt", headers={'User-Agent': 'Mozilla/5.0'})
htmltext = urllib.request.urlopen(req).read()
if htmltext is None:
print("nada")
else:
regex='<title>(.+?)</title>'
pattern=re.compile(regex)
price=pattern.findall(str(htmltext))
print(price[0])
regex='<meta name="description" content=(.+?)/>'
pattern=re.compile(regex)
prices=pattern.findall(str(htmltext))
print(prices[0])
我的问题是我的网页有葡萄牙语字符,我得到类似的东西 rel \ xc3 \ xb3gios homem loja online 我怎样才能解决这个问题并得到原始的字符? 谢谢
答案 0 :(得分:0)
您需要解码响应。
return(this.customRender());