如何在python中处理unicode语言

时间:2015-07-10 16:55:50

标签: python unicode

我正在写一个Python + Selenium脚本来废弃Linkedin网站 我使用此语句阅读了配置文件摘要,该语句正常工作:

profileDescription = profile.find_element_by_xpath("div/div[1]").text  

我的问题是来自网站的非英语数据 我正在使用以下代码将从网站上报废的数据写入Excel:

with open('search.csv', 'ab') as csvfile:
    self.liSearchOutWriter = csv.writer(csvfile, delimiter=',')
    self.liSearchOutWriter.writerow([profileDescription]) 

每当描述包含非英语数据时,它都无法在excel中正确显示。我通读了unicodeutf8资源,但无法抓住它。

有人可以帮我理解如何修改我的代码以便正确显示非英语数据吗?

1 个答案:

答案 0 :(得分:1)

在Python 3.X中,这是开箱即用的支持:

 import csv
 with open('search.csv', newline='', encoding='utf-8') as csvfile:
     reader = csv.reader(csvfile)
     for row in reader:
         print(row)

如果你在Python 2.X中有一个支持unicode的csv的插件库: unicode-csv

import unicodecsv
with open('search.csv', newline='', encoding='utf-8') as csvfile:
    unicodecsv.reader(f, encoding='utf-8'