无法使用mysql和hibernate持久化emojis

时间:2014-07-22 11:44:37

标签: java mysql hibernate unicode

我实际上已在Stackoverflow上多次发现此问题,但解决方案对我没有帮助。

我的Android应用程序中有一个聊天模块,并希望在我的服务器数据库中保留这些消息,这样可以正常工作,直到出现像emojis这样的特殊字符。

ERROR: Incorrect string value: '\xF0\x9F\x98\x81' for column 'message' at row 1
...
...
Caused by: java.sql.SQLException: Incorrect string value: '\xF0\x9F\x98\x81' for column 'message' at row 1
    at com.mysql.jdbc.SQLError.createSQLException(SQLError.java:1084)
    at com.mysql.jdbc.MysqlIO.checkErrorPacket(MysqlIO.java:4232)
    at com.mysql.jdbc.MysqlIO.checkErrorPacket(MysqlIO.java:4164)
    at com.mysql.jdbc.MysqlIO.sendCommand(MysqlIO.java:2615)
    at com.mysql.jdbc.MysqlIO.sqlQueryDirect(MysqlIO.java:2776)
    at com.mysql.jdbc.ConnectionImpl.execSQL(ConnectionImpl.java:2838)
    at com.mysql.jdbc.PreparedStatement.executeInternal(PreparedStatement.java:2082)
    at com.mysql.jdbc.PreparedStatement.executeUpdate(PreparedStatement.java:2334)
    at com.mysql.jdbc.PreparedStatement.executeUpdate(PreparedStatement.java:2262)
    at com.mysql.jdbc.PreparedStatement.executeUpdate(PreparedStatement.java:2246)
    at org.hibernate.engine.jdbc.internal.ResultSetReturnImpl.executeUpdate(ResultSetReturnImpl.java:187)
... 23 more

我的环境是:

-Mysql 5.6
-Tomcat 8.0.8
-Hibernate 4.3.5
-JDK 1.8.0_05

这是有问题的列的使用表,'message':

table properties

这些是我在persistence.xml(版本2.1)中的属性:

<property name="javax.persistence.jdbc.driver" value="com.mysql.jdbc.Driver" />
<property name="javax.persistence.jdbc.url" value="jdbc:mysql://localhost:3306/gamedb?useUnicode=true&amp;characterEncoding=UTF-8" />
<property name="javax.persistence.jdbc.user" value="*********" />
<property name="javax.persistence.jdbc.password" value="**************" />

<property name="hibernate.hbm2ddl.auto" value="update" />
<property name="hibernate.dialect" value="org.hibernate.dialect.MySQL5Dialect" />
<property name="hibernate.connection.useUnicode" value="true" />
<property name="hibernate.connection.characterEncoding" value="utf8" />

现在我尝试了以下解决方案而没有效果:

-Change datatype of 'message' from varchar to longtext
-Change collation of 'message' to utf8mb4
-Change collation of table to utf8mb4
-Append url with "?useUnicode=true&amp;characterEncoding=UTF-8"
-Set character-set-server of mysql to utf8mb4

我认为表情符号正确传输到服务器,然后它会持续显示消息,然后将其广播回应用程序并正确显示。

8 个答案:

答案 0 :(得分:6)

我曾经遇到过同样的问题。我不知道一个漂亮的解决方案,但这对我有用。

创建Session对象后,我手动更改了连接排序规则:

s.doReturningWork(new ReturningWork<Object>() {
    @Override
    public Object execute(Connection conn) throws SQLException
    {
        try(Statement stmt = conn.createStatement()) {
            stmt.executeQuery("SET NAMES utf8mb4");
        }

        return null;
    }
});

答案 1 :(得分:4)

解决方案是use utf8mb4 rather than utf8 in MySQL。我链接的博客文章解释了如何做到这一点。

答案 2 :(得分:3)

如果您将 hibernate c3p0 一起使用,则可以使用c3p0 config connectionCustomizerClassName ,您可以将其设置为使用连接c3p0的类得到。

示例:

的hibernate.cfg.xml

<property name="hibernate.c3p0.connectionCustomizerClassName">com.hzmoyan.newlyappserver.db.C3p0UseUtf8mb4</property>

C3p0UseUtf8mb4 class

public class C3p0UseUtf8mb4 extends  AbstractConnectionCustomizer{
     @Override
    public void onAcquire(Connection c, String parentDataSourceIdentityToken)
        throws Exception {
        super.onAcquire(c, parentDataSourceIdentityToken);
        try(Statement stmt = c.createStatement()) {
            stmt.executeQuery("SET NAMES utf8mb4");
        }
    }
}

答案 3 :(得分:0)

我刚刚发现了一个不错的小黑客,无需添加任何代码即可使用。如果将验证查询设置为SET NAMES utf8mb4,则它将在获取连接时执行此操作,因此每次检索新连接时都会设置参数。你还需要借用测试来完成这项工作。

注意我发现重启后有时需要几秒钟才能工作,如果你有记录等待在启动时处理,可能会失败

因此,在您的application.properties中,您可以添加类似

的内容
datasource.test-on-borrow=true
datasource.validation-query=SET NAMES utf8mb4

答案 4 :(得分:0)

我能够通过在连接URL中提供以下内容来解决此问题;

useUnicode = true&characterEncoding = UTF-8

示例;

jdbc:mysql://localhost/database?useUnicode=true&characterEncoding=UTF-8

答案 5 :(得分:0)

也许您需要将休眠配置修改为

<property name="hibernate.connection.characterEncoding" value="utf8mb4" />

答案 6 :(得分:0)

如果您的数据源是org.apache.commons.dbcp.BasicDataSource,则可以设置connectionInitSqls参数

    <bean id="dataSource"
          class="org.apache.commons.dbcp.BasicDataSource"
          p:driverClassName="${jdbc.driverClassName}"
          p:url="${jdbc.databaseurl}"
          p:username="${jdbc.username}"
          p:password="${jdbc.password}"
          p:testOnBorrow="true"
          p:maxActive="1000"
          p:testWhileIdle="true"
          p:validationQuery="SELECT 1"
          p:validationQueryTimeout="5">

        <property name="connectionInitSqls">
            <list>
                <value>SET NAMES 'utf8mb4' COLLATE 'utf8mb4_unicode_ci'</value>
            </list>
        </property>

    </bean>

答案 7 :(得分:-1)

在没有收到我的评论的进一步答案后,我找到了另一种解决方案:Base64。

我没有教我的数据库来理解utf8mb4,而是在存储它们之前将所有关键消息编码到Base64,并在从数据库中检索它们时解码它们。

临:
- 效果很好
- 已经为java和android提供了库

魂斗罗:
- Base64字符串比纯utf8mb4字符串占用更多空间(多33%-36%)
- 可能会花费一些性能编码和解码