这是我的程序
from bs4 import BeautifulSoup
import urllib.request
import re
import sys
print (sys.stdout.encoding)
url = "http://autochel.ru/car/motors/foreign/ford/"
page = urllib.request.urlopen(url)
soup = BeautifulSoup(page.read(), "html.parser", from_encoding = "koi8r")
rows=soup.find_all('tr', {"id" : re.compile("^row")})
print(len(rows))
for row in rows:
print (row.text)
它会返回这样的字符串
\ xd0 \ xa7 \ xd0 \ xb5 \ xd0 \ xbb \ xd1 \ x8f \ xd0 \ xb1 \ xd0 \ xb8 \ xd0 \ xbd \ xd1 \ x81 \ xd0 \ xba
是
在我检查的KOI8-R编码中Челябинск
,我需要将此值打印到控制台。
我在python中完全是新手,所以我尝试了一些我能找到的东西:我尝试用
设置默认编码#!/usr/bin/env python
# -*- coding: koi8-r -*-
或
#!/usr/bin/env python
# -*- coding: utf-8 -*-
我尝试row.text.encode()
到utf-8,到koi8-r
我有点厌倦和失望所以,我要求社区帮助我。如果你帮助我,我会很高兴。