所以我有一个奇怪的截断问题!找不到具体的答案。
所以基本上存在明显的ISO字符½的问题,当插入指定了UTF-8的列时,它会截断文本的其余部分。
让我们说我的字符串是:“你需要添加半杯水。” MySQL会将其截断为“你需要添加”
如果我:
print iconv("ISO-8859-1", "UTF-8//IGNORE", $text);
然后输出:
½
O_O
好的,这不起作用,因为我需要1/2本身。如果我去phpMyAdmin并复制并粘贴句子并提交它,它就像一个魅力,因为整个字符串在那里有半个符号和剩余文本!有些事情是错的,我很困惑它是什么。我知道这可能会影响其他角色,因此需要解决潜在的问题。
我使用的语言是php,文件本身编码为UTF-8,我引入的数据的内容类型设置为ISO-8859-1。列是utf8_general_ci,并且所有mysql字符集在php中都设置为UTF-8:“SET character_set_result ='utf8'等等......”
答案 0 :(得分:4)
代码中的某些内容并不是将字符串作为UTF8处理。它可能是你的PHP / HTML,它可能是你与数据库的连接,或者它可能是数据库本身 - 一切都必须设置为UTF8一致,如果有什么不是,字符串将被完全截断正如你所看到的那样,当你越过UTF8 /非UTF8边界时。
我将假设您的数据库符合UTF8标准 - 这是最容易检查的。请注意,可以在表中的服务器级别,数据库级别,表级别和列级别设置排序规则。在列上设置UTF8排序规则应该覆盖任何其他存储空间,但如果它们不是UTF8,则在与数据库通信时其他人仍将启动。如果您不确定,请在打开后明确将连接设置为UTF8:
$dbh->setAttribute(PDO::MYSQL_ATTR_INIT_COMMAND, "SET NAMES 'utf8'");
现在你的DB&连接是UTF8,请确保您的网页也是如此。同样,这可以在多个地方设置(.htaccess,php.ini)。如果您不确定/无法访问权限,只需覆盖页面顶部默认提取的PHP内容:
<?php ini_set('default_charset', 'UTF-8'); ?>
请注意,在从页面输出任何文本之前,您需要在开始时使用上述权限。一旦输出文本,尝试指定编码可能为时已晚 - 您可能已经被锁定到服务器上的默认值。我也在我的标题中重复这个(可能是矫枉过正):
<head>
<meta charset="UTF-8">
<meta http-equiv="Content-type" content="text/html; charset=UTF-8">
</head>
我在表格中覆盖了它,我也在那里收集数据:
<FORM NAME="utf8-test" METHOD="POST" ACTION="utf8-test.php" enctype="multipart/form-data" accept-charset="UTF-8">"
说实话,如果您已将编码设置在顶部,我的理解是其他覆盖是不必要的 - 但无论如何我保留它们,因为它不会破坏任何东西而且我只是明确地陈述编码,而不是让服务器做出假设。
最后,你提到在phpMyAdmin中你插入了字符串,它看起来像预期的那样 - 你确定phpMyAdmin页面是UTF8吗?我不认为他们是。当我从PHP代码存储UTF8数据时,它会像phpMyAdmin中的原始8位字符一样查看。如果我使用相同的字符串并将其直接存储在phpMyAdmin中,它看起来是正确的&#39;。所以我猜测phpMyAdmin正在使用我本地服务器的默认字符集,不一定是UTF8。
例如,从我的网页存储以下字符串:
I can¹t wait
在我的phpMyAdmin中读取这样的内容:
I can’t wait
因此,在进行测试时要小心,因为您并不知道phpMyAdmin用于显示或数据库连接的编码。
如果您仍然遇到问题,请尝试下面的代码。首先,我创建一个表来存储UTF8中的文本:
CREATE TABLE IF NOT EXISTS `utf8_test` (
`id` int(11) NOT NULL AUTO_INCREMENT,
`my_text` varchar(8000) NOT NULL,
PRIMARY KEY (`id`)
) ENGINE=MyISAM DEFAULT CHARSET=utf8 AUTO_INCREMENT=1 ;
这里有一些PHP来测试它。它基本上将您的输入放在表单上,回显给您输入,并存储/检索数据库中的文本。就像我说的,如果你直接在phpMyAdmin中查看数据,你可能会发现它看起来并不正确,但是由于页面和页面的不同,通过下面的页面它应该总是按预期显示。数据库连接都被锁定为UTF8。
<?php
// Override whatever is set in php.ini
ini_set('default_charset', 'UTF-8');
// The following should not be required with the above override
//header('Content-Type:text/html; charset=UTF-8');
// Open the database
$dbh = new PDO('mysql:dbname=utf8db;host=127.0.0.1;charset=utf8', 'root', 'password');
// Set the connection to UTF8
$dbh->setAttribute(PDO::MYSQL_ATTR_INIT_COMMAND, "SET NAMES 'utf8'");
// Tell MySql to do the parameter replacement, not PDO
$dbh->setAttribute(PDO::ATTR_EMULATE_PREPARES, false);
// Throw exceptions (and break the code) if a query is bad
$dbh->setAttribute(PDO::ATTR_ERRMODE, PDO::ERRMODE_EXCEPTION);
$id = 0;
if (isset($_POST["StoreText"]))
{
$stmt = $dbh->prepare('INSERT INTO utf8_test (my_text) VALUES (:my_text)');
$stmt->execute(array(':my_text' => $_POST['my_text']));
$id = $dbh->lastInsertId();
}
?>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional/EN" "http://www.w3.org/TR/xhtml11/DTD/xhtml11-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta charset="UTF-8">
<meta http-equiv="Content-type" content="text/html; charset=UTF-8">
<title>UTF-8 Test</title>
</head>
<body>
<?php
// If something was posted, output it
if (isset($_POST['my_text']))
{
echo "POSTED<br>\n";
echo $_POST['my_text'] . "<br>\n";
}
// If something was written to the database, read it back, and output it
if ($id > 0)
{
$stmt = $dbh->prepare('SELECT my_text FROM utf8_test WHERE id = :id');
$stmt->execute(array(':id' => $id));
if ($result = $stmt->fetch())
{
echo "STORED<br>\n";
echo $result['my_text'] . "<br>\n";
}
}
// Create a form to take some user input
echo "<FORM NAME=\"utf8-test\" METHOD=\"POST\" ACTION=\"utf8-test.php\" enctype=\"multipart/form-data\" accept-charset=\"UTF-8\">";
echo "<br>";
echo "<textarea name=\"my_text\" rows=\"20\" cols=\"90\">";
// If something was posted, include it on the form
if (isset($_POST['my_text']))
{
echo $_POST['my_text'];
}
echo "</textarea>";
echo "<br>";
echo "<INPUT TYPE = \"Submit\" Name = \"StoreText\" VALUE=\"Store It\" />";
echo "</FORM>";
?>
<br>
</body>
</html>
答案 1 :(得分:0)
如果无法更改数据的处理方式,请检查mb_convert_encoding。否则,请自己帮忙,并在失控之前将编码放在同一页面上。 UTF-8使用多字节字符,这些字符在ISO-8859-1(拉丁语)编码中无法识别。 wikipedia。 This page和this page是很好的来源,以及this debug table。
最后,当我使用htmlentities,htmlspecialchars和html_entity_decode的各种组合时,我遇到了这个问题。
答案 2 :(得分:0)
您是否在MySQLi数据库连接上调用了set_charset()
?需要正确使用real_escape_string()
。
$db = new mysqli(...);
$db->set_charset('utf8');
在连接中设置会话变量是不够的 - 这会影响服务器端发生的事情。 set_charset
会影响客户端发生的事情。
您可以查看PHP参考mysqli::real_escape_string