我在Python代码中使用名为Storm的Active Record来检索MySQL数据库中的某些记录。
问题是:我的表位于'utf8_unicode_ci',但当我检索对象时,我得到'latin-1'属性,所以我需要做object.attr.decode('latin-1')。encode( 'utf-8')总是不起作用 - 抛出一些例外。
我的问题:这是一个python行为? MySQL的行为?与风暴有关的东西?
代码:
Storm.conn(user=db_user,db=db_name, passwd=db_passwd)
events = Event.select('*',status='=2',date_end='>=NOW()')
for event in events:
now = datetime.datetime.now().strftime("%Y-%m-%d %H:%M")
try:
#here we need only utf-8 strings
conn.index({"title": event.get_title(), "local": event.get_local(), "url": event.getUrl(), "description": event.get_description(), "artists": event.get_artists(), "tags": event.get_tags(), "picture": event.get_Picture(), "type": event.get_type(), 'date_begin': event.get_date_begin(), 'date_end': event.get_date_end(), '_ttl': event.get_ttl()}, "wf", "event", event.id)
print 'Indexed - '+now+': '+str(event.id)
except Exception,error:
print 'Error - '+now+': '+str(event.id)+" - "+str(error)
答案 0 :(得分:2)
不知道堆栈的细节,但是使用MySQL,您需要将连接的编码与表的编码分开设置。我有一些unicode表,我花了很长时间才意识到连接设置为latin-1,所以我的unicode数据被解释为Latin-1字节,并在远端“转换”为无意义的unicode。
答案 1 :(得分:1)
也许这个答案看起来很愚蠢,但试着打印出来 在解释器路径
之后的py文件的顶部#!/usr/bin/env python
# -*- coding: utf-8 -*-