Question

我正在使用scrapy和django。清理数据时，我使用：

html = re.sub(r'(™|®|©|&trade;|&reg;|&copy;|&#8482;|&#174;|&#169;)', '',html, flags=re.IGNORECASE)

在普通的python shell中运行很好。但是，每当我尝试使用scrapy爬网运行时，我都会收到此错误：

SyntaxError：文件中的非ASCII字符'\ xe2' / somefile / 在第105行，但没有声明编码;看到 http://www.python.org/peps/pep-0263.html了解详情

有人可以帮帮我吗。谢谢！

Answer 1

我在我的文件中声明了编码：

#!/usr/bin/python
# -*- coding: utf-8 -*-

确保将它们放在文件的第一行。这似乎解决了我的问题。

谢谢大家！