Python BeautifulSoup或CSV编码问题

时间:2013-11-10 12:52:48

标签: python csv unicode beautifulsoup

我一直在寻找将HTML表转换为CSV格式,并且遇到以下情况,看起来很有前景(因为我也在尝试学习Python) https://stackoverflow.com/a/16697784/838253

不幸的是,它对我的​​样本不起作用,我遇到错误

UnicodeEncodeError: 'ascii' codec can't encode character u'\xa0' in position 753: ordinal not in range(128)

这似乎是BeautifulSoup stripped_strings将不间断空格 转换为u'\xa0'的结果 这看起来像完全正常的Unicode(虽然将多个 转换为单个'u'\ xa0'似乎有点偏离)

错误似乎来自csv模块。 为什么不能处理标准的Unicode,处理这个问题的最佳方法是什么?

1 个答案:

答案 0 :(得分:1)

在Python 2.7中,csv模块不支持unicode,请参阅documentation开头的注释。

您可以使用examples中的UnicodeWriter来编写带有Unicode的csv数据。