我一直在寻找将HTML表转换为CSV格式,并且遇到以下情况,看起来很有前景(因为我也在尝试学习Python) https://stackoverflow.com/a/16697784/838253
不幸的是,它对我的样本不起作用,我遇到错误
UnicodeEncodeError: 'ascii' codec can't encode character u'\xa0' in position 753: ordinal not in range(128)
这似乎是BeautifulSoup
stripped_strings
将不间断空格
转换为u'\xa0'
的结果
这看起来像完全正常的Unicode(虽然将多个
转换为单个'u'\ xa0'似乎有点偏离)
错误似乎来自csv
模块。
为什么不能处理标准的Unicode,处理这个问题的最佳方法是什么?
答案 0 :(得分:1)
在Python 2.7中,csv
模块不支持unicode,请参阅documentation开头的注释。
您可以使用examples中的UnicodeWriter
来编写带有Unicode的csv数据。