使用正则表达式编码时出错

时间:2015-02-23 23:26:31

标签: python regex django scrapy

我正在使用scrapy和django。清理数据时,我使用:

html = re.sub(r'(™|®|©|™|®|©|™|®|©)', '',html, flags=re.IGNORECASE)

在普通的python shell中运行很好。但是,每当我尝试使用scrapy爬网运行时,我都会收到此错误:

  

SyntaxError:文件中的非ASCII字符'\ xe2'   / somefile /   在第105行,但没有声明编码;看到   http://www.python.org/peps/pep-0263.html了解详情

有人可以帮帮我吗。谢谢!

1 个答案:

答案 0 :(得分:0)

我在我的文件中声明了编码:

#!/usr/bin/python
# -*- coding: utf-8 -*-

确保将它们放在文件的第一行。 这似乎解决了我的问题。

谢谢大家!