我正在使用scrapy和django。清理数据时,我使用:
html = re.sub(r'(™|®|©|™|®|©|™|®|©)', '',html, flags=re.IGNORECASE)
在普通的python shell中运行很好。但是,每当我尝试使用scrapy爬网运行时,我都会收到此错误:
SyntaxError:文件中的非ASCII字符'\ xe2' / somefile / 在第105行,但没有声明编码;看到 http://www.python.org/peps/pep-0263.html了解详情
有人可以帮帮我吗。谢谢!
答案 0 :(得分:0)
我在我的文件中声明了编码:
#!/usr/bin/python
# -*- coding: utf-8 -*-
确保将它们放在文件的第一行。 这似乎解决了我的问题。
谢谢大家!