异常中的SQLAlchemy Unicode问题

时间:2017-04-23 02:14:57

标签: postgresql unicode sqlalchemy python-2.x

我正在使用postgres / SQLAlchemy / Flask-Admin处理Flask应用。但是,在Admin界面中,由于unicode(exc)引发UnicodeDecodeError,因此无法报告包含Unicode字母的任何数据库错误。

我能够将问题发现到sqlalchemy.exc

class StatementError(SQLAlchemyError):
    ...
    def __unicode__(self):
        return self.__str__()

通过以下方式重现问题:

class A(Base):
    __tablename__="a"
    id = Column(Integer, primary_key=True)
    name = Column(String)
    name2 = Column(String, nullable=False)

session = Session()
a = A(name=u"עברית")
session.add(a)

try:
    session.commit()
except Exception as e:
    print(repr(e))
    print("------------------")
    print(unicode(e))

返回:

ProgrammingError('(psycopg2.ProgrammingError) column "name" of relation "a" does not exist\nLINE 1: INSERT INTO a (name, name2) VALUES (\'\xd7\xa2\xd7\x91\xd7\xa8\xd7\x99\xd7\xaa\', NULL) RETURNING...\n                       ^\n',)
------------------
Traceback (most recent call last):
  File "test.py", line 27, in <module>
    print(unicode(e))
UnicodeDecodeError: 'ascii' codec can't decode byte 0xd7 in position 118: ordinal not in range(128)

我目前通过用从utf-8解码的类替换相关的异常来解决它。然而,这是一个可怕的黑客攻击,我正在寻找一个合适的解决方案:

  • 有没有办法配置SQLAlchemy来自动解码收到的错误消息?
  • 有没有办法配置Postgres以latin编码输出消息(不太有利,但可以接受)
  • 有没有办法让unicode尝试按utf-8代替ascii / latin进行解码?
  • 有没有办法解决它???

(这个问题只与Python2有关。在Python3中,上面的代码可以工作。我相信这是因为默认编码是utf-8

1 个答案:

答案 0 :(得分:2)

我实际上认为从您的应用程序修补SQLAlchemy是正确的合理清洁解决方案。这就是原因:

  • 您已经发现了一些通常被认为是SQLAlchemy中的错误的内容。

  • 您可以编写一个对SQLAlchemy当前使用的所有情况都行为相同的补丁。也就是说,您的补丁不会破坏现有代码

  • 概率非常高,即使SQLAlchemy得到修复,你的补丁也是无害的。

  • 进行此更改可以减少整个代码中SQLAlchemy错误对解决方案的影响,例如更改可能打印异常的每个位置。

  • 更改PostGres以返回latin1编码实际上不会有帮助,因为python正在使用ascii编码,这在给定latin1字符串时会产生相同的错误。此外,更改PostGres以返回latin1错误可能涉及更改连接编码;这可能会为unicode数据带来问题。

这是一个修补sqlalchemy.exc.StatementError并测试补丁的简单程序。如果你想要甚至可以尝试生成包括unicode在内的异常,请将其转换为unicode,并且只有在引发UnicodeDecodeError时才应用补丁。如果您这样做,当sqlalchemy解决问题时,您的补丁将自动停止应用。

# -*- coding: utf-8 -*-
from sqlalchemy.exc import StatementError

def statement_error_unicode(self):
    return unicode(str(self), 'utf-8')
# See <link to sqlalchemy issue>; can be removed once we require a
# version of sqlalchemy with a fix to that issue
StatementError.__unicode__ = statement_error_unicode

message = u'Sqlalchemy unicode '
message_str = message.encode('utf-8')
error = StatementError(message_str, 'select * from users', tuple(), '')
print unicode(error)