如何从我的页面获取俄语文本并使用python放入HTML元素

时间:2015-08-02 21:08:43

标签: python unicode

我收到了我的文字:

response = urllib2.urlopen("http://mypage/mytext.php")
page_source = response.read()
page_source
"({code:'\xd0\x9f\xd1\x80\xd0\xb8\xd0\xb2\xd0\xb5\xd1\x82 \xd0\x92\xd1\x81\xd0\xb5\xd0\xbc!'});"

然后我必须使用:

driver.find_element_by_name("mytext").send_keys(page_source)

如何将page_source转换为俄语字符?

1 个答案:

答案 0 :(得分:0)

response.read()返回字节。要将它们转换为文本,您需要知道相应的字符编码:

text = response.read().decode(response.headers.getparam('charset'))

A good way to get the charset/encoding of an HTTP response in Python

.send_keys()要么按原样接受Unicode文本,要么应该使用预期的字符编码传递字节 - 它可能与用于响应的编码不同:

...send_keys(text) # pass Unicode as is
...send_keys(text.encode(some_encoding)) # or pass bytes