Java + Mysql UTF8问题

时间:2010-07-18 12:40:44

标签: java mysql xml utf-8 insert

正如标题所说,我在java和mysql之间存在问题

mysql数据库,表和列是utf8_unicode_ci。 我有一个应用程序从xml获取一些输入,然后编写查询...

public String [] saveField(String xmltag, String lang){     
  NodeList nodo = this.doc.getElementsByTagName(xmltag);
  String [] pos = new String[nodo.getLength()];     
  for (int i = 0 ; i < nodo.getLength() ; i++ ) {
     Node child = nodo.item(i);
     pos[i] =  "INSERT INTO table (id, lang, value) VALUES (" +
        child.getAttributes().getNamedItem("id").getNodeValue().toString() + " , " +
        lang + " , " + 
        "'" + child.getFirstChild().getTextContent() + "'" +
        ");";       
    }   
   return pos;
}

此方法返回包含一个或多个SQL插入查询的String数组... 那么

Class.forName("com.mysql.jdbc.Driver").newInstance();
con = DriverManager.getConnection("jdbc:mysql:///dbname", "user", "pass");
.....
Statement s; s =
this.con.createStatement ();
s.execute(query);

s.execytes.executeUpdate这两个特殊字符都存储为?

因此没有正确存储特殊字符: מסירות קצרות存储为?????????

Hi!存储为Hi!

有什么建议吗?

由于

2 个答案:

答案 0 :(得分:85)

解决, 我忘了在初始化Connection时添加编码:

之前是:

con = DriverManager.getConnection("jdbc:mysql:///dbname", "user", "pass");

现在(工作):

con = DriverManager.getConnection("jdbc:mysql:///dbname?useUnicode=true&characterEncoding=utf-8", "user", "pass");

答案 1 :(得分:11)

AUGH!

好的,所以,这不是直接你要求的东西,但是这个:

 pos[i] =  "INSERT INTO table (id, lang, value) VALUES (" +
    child.getAttributes().getNamedItem("id").getNodeValue().toString() + " , " +
    lang + " , " + 
    "'" + child.getFirstChild().getTextContent() + "'" +
    ");";       

取消所有内部“请勿做此事”警报。

您是否对传入的文本有绝对和完全的控制权?你确定有人不会在收到的文本中有撇号,即使是偶然吗?

请重构您的代码,而不是创建SQL文本,以便最终调用:

PreparedStatement pstmt =
    con.prepareStatement("INSERT INTO table (id, lang, value) VALUES (?,?,?)");
// then, in a loop:
pstmt.setString(0, child.getAttributes().getNamedItem("id").getNodeValue().toString());
pstmt.setString(1, lang);
pstmt.setString(2, child.getFirstChild().getTextContent());
pstmt.execute();

也就是说,让DB转义文本。请,除非有一天你想要进行this one之类的对话。作为一个有利的副作用,这种方法可以解决您的问题,假设当您从XML中读取它们时字符串值仍然是正确的。 (正如其他人提到的那样,当您从XML中读取内容时,很可能会出现问题)