htmlentities()使汉字无法使用

时间:2011-06-23 10:40:28

标签: php html-entities

我们有一个Web应用程序,我们允许用户在文本区域中输入自己的html。我们将这些数据保存到我们的数据库中。

当我们将html数据加载到文本区域时,当然,我们在将html数据放入textarea之前使用htmlentities()。否则用户可以在textarea中保存,并且我们的应用程序在将其加载到textarea时会中断。

除了输入中文字符(以及其他语言,如阿拉伯语,日语)外,这种方法很有效。

htmlentities()使中文文字不可用,如下所示:à ¨ó³ü¼ü§ï¯ 当我在将输入的html加载到文本区域之前删除htmlentities()时,中文字符显示正常,但是我们遇到HTML干扰我们的textarea的问题,特别是当用户进入文本区域时。

我希望这是有道理的。

有没有人知道我们如何安全,正确地允许在我们的文本区域内使用中文,日文等语言,同时仍然可以安全地在我们的文本区域内加载任何html?

4 个答案:

答案 0 :(得分:5)

您是否尝试过使用htmlspecialchars

我目前在生产中使用它,这很好。

$foo = "我的名字叫萨沙"
echo '<textarea>' . htmlspecialchars($foo) . '</textarea>';

可替换地,

$str = “&#20320;&#22909;”;
echo mb_convert_encoding($str, ‘UTF-8′, ‘HTML-ENTITIES’);

http://www.techiecorner.com/129/php-how-to-convert-iso-character-htmlentities-to-utf-8/

上找到

答案 1 :(得分:2)

指定字符集,例如UTF-8,它应该工作。

echo htmlentities($data, ENT_COMPAT, 'UTF-8'); 

答案 2 :(得分:2)

PHP在框架范围内对国际字符集的支持方面令人震惊(虽然它正在慢慢变得更好,特别是在PHP5中,但是你没有指定你正在使用哪个版本)。但是,有一些mb_(多字节,如多字节字符)功能可以帮助您解决问题。

此示例可以帮助您(来自here):

<?php 
/** 
 *  Multibyte equivalent for htmlentities() [lite version :)] 
 * 
 * @param string $str 
 * @param string $encoding 
 * @return string 
 **/ 
function mb_htmlentities($str, $encoding = 'utf-8') { 
    mb_regex_encoding($encoding); 
    $pattern = array('<', '>', '"', '\''); 
    $replacement = array('&lt;', '&gt;', '&quot;', '&#39;'); 
    for ($i=0; $i<sizeof($pattern); $i++) { 
        $str = mb_ereg_replace($pattern[$i], $replacement[$i], $str); 
    } 
    return $str; 
} 
?>

另外,请确保您的页面指定了相同的字符集。您可以使用元标记执行此操作:

<meta http-equiv="Content-Type" content="text/html; charset=utf-8">

答案 3 :(得分:0)

很可能你没有使用正确的编码。如果您已经知道输出编码,请使用html_entities functioncharset参数。

如果您还没有确定内部编码,请查看iconv函数; iconv_set_encoding("internal_encoding", "UTF-8");可能是一个好的开始。