我在Windows平台上用python 3.4创建了一个Django应用程序。现在我正在尝试在AWS Linux实例上托管它。我第一次遇到以下错误
非ASCII字符'\ xe2'
我通过在每个页面上添加utf解决了这个问题。
- - 编码:utf-8 - -
现在我面临以下错误
'ascii'编解码器无法解码位置18中的字节0xe2:序数不在 范围(128)
代码:
class TaskTodo:
@classmethod
def validate_search(cls, form_data):
try:
search_url = 'https://www.foo.com/s-{search}/page-{page}'
url = search_url.format(page=1, search=form_data['keywords'])
url = url.encode('utf-8')
r = requests.get(url)
not_found_text = 'Sorry, but we didn’t find any results. Below you can find some tips to help you in your search.'
if not_found_text in r.text.encode('utf-8'):
return
#after encoding its not working on localhost
#'str' does not support the buffer interface
if r.status_code == 200:
content = r.text
soup = BeautifulSoup(content, "html.parser")
total = soup.find('span', {"class": 'count'}).text.replace('words', '').replace(',', '').strip()
pages = 1
last_page = soup.find('a', {"class": 'last follows'})
if last_page:
href = last_page['href'].split('/')
pages = int(href[len(href) - 1].replace('somewords', '').strip())
except Exception as ex:
raise ex
我已经搜索并尝试实现编码等但不起作用。我已经完成了应用程序,并且大多数函数正在对http进行请求,解析html等。我真的很担心在生产服务器上进行调试并对每个函数进行编码。
我在生产服务器上使用Apache并尝试使用python版本2.7和3.5
知道如何解决此问题。感谢
答案 0 :(得分:1)
在聊天室中与OP合作后,仍然不清楚实际问题的来源。
我注意到文字'Sorry, but we didn’t
包含非ascii 'RIGHT SINGLE QUOTATION MARK'
因此,我建议通过将not_found_text
附加到字符串值来使u''
成为Unicode。
我还建议删除所有虚假的.encodes()
和.decodes()
。