我们有一个Web应用程序,我们允许用户在文本区域中输入自己的html。我们将这些数据保存到我们的数据库中。
当我们将html数据加载到文本区域时,当然,我们在将html数据放入textarea之前使用htmlentities()。否则用户可以在textarea中保存,并且我们的应用程序在将其加载到textarea时会中断。
除了输入中文字符(以及其他语言,如阿拉伯语,日语)外,这种方法很有效。
htmlentities()使中文文字不可用,如下所示:à ¨ó³ü¼ü§ï¯ 当我在将输入的html加载到文本区域之前删除htmlentities()时,中文字符显示正常,但是我们遇到HTML干扰我们的textarea的问题,特别是当用户进入文本区域时。
我希望这是有道理的。
有没有人知道我们如何安全,正确地允许在我们的文本区域内使用中文,日文等语言,同时仍然可以安全地在我们的文本区域内加载任何html?
答案 0 :(得分:5)
您是否尝试过使用htmlspecialchars?
我目前在生产中使用它,这很好。
$foo = "我的名字叫萨沙"
echo '<textarea>' . htmlspecialchars($foo) . '</textarea>';
可替换地,
$str = “你好”;
echo mb_convert_encoding($str, ‘UTF-8′, ‘HTML-ENTITIES’);
在http://www.techiecorner.com/129/php-how-to-convert-iso-character-htmlentities-to-utf-8/
上找到答案 1 :(得分:2)
指定字符集,例如UTF-8,它应该工作。
echo htmlentities($data, ENT_COMPAT, 'UTF-8');
答案 2 :(得分:2)
PHP在框架范围内对国际字符集的支持方面令人震惊(虽然它正在慢慢变得更好,特别是在PHP5中,但是你没有指定你正在使用哪个版本)。但是,有一些mb_
(多字节,如多字节字符)功能可以帮助您解决问题。
此示例可以帮助您(来自here):
<?php
/**
* Multibyte equivalent for htmlentities() [lite version :)]
*
* @param string $str
* @param string $encoding
* @return string
**/
function mb_htmlentities($str, $encoding = 'utf-8') {
mb_regex_encoding($encoding);
$pattern = array('<', '>', '"', '\'');
$replacement = array('<', '>', '"', ''');
for ($i=0; $i<sizeof($pattern); $i++) {
$str = mb_ereg_replace($pattern[$i], $replacement[$i], $str);
}
return $str;
}
?>
另外,请确保您的页面指定了相同的字符集。您可以使用元标记执行此操作:
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
答案 3 :(得分:0)
很可能你没有使用正确的编码。如果您已经知道输出编码,请使用html_entities
function的charset
参数。
如果您还没有确定内部编码,请查看iconv函数; iconv_set_encoding("internal_encoding", "UTF-8");
可能是一个好的开始。