Python BeautifulSoup打印koi8-r编码文本为西里尔文

时间:2016-10-31 18:19:20

标签: python encoding beautifulsoup

这是我的程序

from bs4 import BeautifulSoup
import urllib.request
import re
import sys

print (sys.stdout.encoding)
url = "http://autochel.ru/car/motors/foreign/ford/"
page = urllib.request.urlopen(url)

soup = BeautifulSoup(page.read(), "html.parser", from_encoding = "koi8r")
rows=soup.find_all('tr', {"id" : re.compile("^row")})
print(len(rows))
for row in rows:
    print  (row.text)

它会返回这样的字符串

  

\ xd0 \ xa7 \ xd0 \ xb5 \ xd0 \ xbb \ xd1 \ x8f \ xd0 \ xb1 \ xd0 \ xb8 \ xd0 \ xbd \ xd1 \ x81 \ xd0 \ xba

  

Челябинск

在我检查的KOI8-R编码中

,我需要将此值打印到控制台。

我在python中完全是新手,所以我尝试了一些我能找到的东西:我尝试用

设置默认编码
#!/usr/bin/env python
# -*- coding: koi8-r -*-

#!/usr/bin/env python
# -*- coding: utf-8 -*-

我尝试row.text.encode()到utf-8,到koi8-r

我有点厌倦和失望所以,我要求社区帮助我。如果你帮助我,我会很高兴。

0 个答案:

没有答案