java.sql.SQLException:字符串值不正确:'\ xF3 \ xBE \ x8D \ x81'

时间:2010-07-31 06:53:09

标签: java mysql utf-8

我在尝试保存一些推文时遇到以下异常,

  

引起:java.sql.SQLException:字符串值不正确:第1行第'twtText'列的'\ xF3 \ xBE \ x8D \ x81'           在com.mysql.jdbc.SQLError.createSQLException(SQLError.java:1055)           在com.mysql.jdbc.SQLError.createSQLException(SQLError.java:956)           在com.mysql.jdbc.MysqlIO.checkErrorPacket(MysqlIO.java:3491)           在com.mysql.jdbc.MysqlIO.checkErrorPacket(MysqlIO.java:3423)           在com.mysql.jdbc.MysqlIO.sendCommand(MysqlIO.java:1936)           在com.mysql.jdbc.MysqlIO.sqlQueryDirect(MysqlIO.java:2060)           在com.mysql.jdbc.ConnectionImpl.execSQL(ConnectionImpl.java:2542)           在com.mysql.jdbc.PreparedStatement.executeInternal(PreparedStatement.java:1734)           在com.mysql.jdbc.PreparedStatement.executeUpdate(PreparedStatement.java:2019)           在com.mysql.jdbc.PreparedStatement.executeUpdate(PreparedStatement.java:1937)           在com.mysql.jdbc.PreparedStatement.executeUpdate(PreparedStatement.java:1922)           at org.hibernate.id.IdentityGenerator $ GetGeneratedKeysDelegate.executeAndExtract(IdentityGenerator.java:94)           在org.hibernate.id.insert.AbstractReturningDelegate.performInsert(AbstractReturningDelegate.java:57)

我的表格结构如下,所有列都是UTF-8格式,

 CREATE TABLE `tblkeywordtracking` (
  `id` bigint(20) NOT NULL AUTO_INCREMENT,
  `word` varchar(200) NOT NULL,
  `tweetId` bigint(100) NOT NULL,
  `twtText` varchar(800) DEFAULT NULL,
  `negTwtText` varchar(1000) DEFAULT NULL,
  `language` text,
  `links` text,
  `negWt` double DEFAULT NULL,
  `posWt` double DEFAULT NULL,
  `tweetType` varchar(20) DEFAULT NULL,
  `source` text,
  `sourceStripped` text,
  `isTruncated` varchar(40) CHARACTER SET latin1 DEFAULT NULL,
  `inReplyToStatusId` bigint(30) DEFAULT NULL,
  `inReplyToUserId` int(11) DEFAULT NULL,
  `isFavorited` varchar(40) CHARACTER SET latin1 DEFAULT NULL,
  `inReplyToScreenName` varchar(40) DEFAULT NULL,
  `latitude` bigint(100) NOT NULL,
  `longitude` bigint(100) NOT NULL,
  `retweetedStatus` varchar(40) CHARACTER SET latin1 DEFAULT NULL,
  `statusInReplyToStatusId` bigint(100) NOT NULL,
  `statusInReplyToUserId` bigint(100) NOT NULL,
  `statusFavorited` varchar(40) CHARACTER SET latin1 DEFAULT NULL,
  `statusInReplyToScreenName` text,
  `screenName` text,
  `profilePicUrl` text,
  `twitterId` bigint(100) NOT NULL,
  `name` text,
  `location` text,
  `bio` text,
  `utcOffset` int(11) DEFAULT NULL,
  `timeZone` varchar(100) DEFAULT NULL,
  `frenCnt` bigint(20) DEFAULT '0',
  `createdAt` datetime DEFAULT NULL,
  `createdOnGMT` text CHARACTER SET latin1,
  `createdOnServerTime` datetime DEFAULT NULL,
  `follCnt` bigint(20) DEFAULT '0',
  `favCnt` bigint(20) DEFAULT '0',
  `totStatusCnt` bigint(20) DEFAULT NULL,
  `usrCrtDate` varchar(200) DEFAULT NULL,
  PRIMARY KEY (`id`),
  KEY `id` (`id`,`word`),
  KEY `twtText` (`twtText`(333)),
  KEY `word` (`word`,`tweetType`),
  KEY `posWt` (`posWt`,`negWt`)
) ENGINE=MyISAM AUTO_INCREMENT=1740 DEFAULT CHARSET=utf8;

3 个答案:

答案 0 :(得分:9)

您必须将字符集和排序规则添加到列twtText。所以你的专栏应该是这样的:

twtText varchar(800) character set utf8 collate utf8_polish_ci DEFAULT NULL,

使用您想要的排序规则更改utf8_polish_ci

运行以下查询以查看可用的排序规则:

SHOW COLLATION;

答案 1 :(得分:5)

MySQL 5.0 / 5.1不支持4byte UTF8字符,这是一个已知的限制。 MySQL 5.5支持4byte UTF8字符。

请参阅9.1.10. Unicode Support

答案 2 :(得分:2)

它看起来像一个有效的utf-8序列,它编码以下字符U+FE341

如您所见,这是一个使用2个字节以上的Unicode字符。从thisthis我推断出MySQL仍然不支持这个Unicode字符子集(至少对于版本<5.5)。