htmlentities()使中文字符不可用

| 我们有一个Web应用程序,允许用户在文本区域中输入自己的html。我们将该数据保存到我们的数据库中。 当然,当我们将html数据加载到文本区域时,我们在将html数据扔到textarea之前使用htmlentities()。否则,用户可以将其保存在文本区域内,并且将其加载到文本区域时,我们的应用程序将损坏。 这很有效,除了输入中文字符(以及其他语言,例如阿拉伯语,日语)时。 htmlentities()使中文文本无法使用,如下所示:ÃÂ�ÃÂÂü¼¼Ã§§Ã 当我在将输入的html加载到文本区域之前删除htmlentities()时,汉字显示得很好,但是然后我们遇到了HTML干扰文本区域的问题,尤其是当用户在文本区域内输入时。 我希望这是有道理的。 有谁知道我们如何安全,正确地允许在文本区域内使用中文,日语,...等语言,同时仍然可以安全地在文本区域内加载任何html?     
已邀请:
        您是否尝试过使用htmlspecialchars? 我目前在生产中使用它,还可以。
$foo = \"我的名字叫萨沙\"
echo \'<textarea>\' . htmlspecialchars($foo) . \'</textarea>\';
交替,
$str = “&#20320;&#22909;”;
echo mb_convert_encoding($str, ‘UTF-8′, ‘HTML-ENTITIES’);
如http://www.techiecorner.com/129/php-how-to-convert-iso-character-htmlentities-to-utf-8/     
        指定字符集,例如UTF-8,它应该可以工作。
echo htmlentities($data, ENT_COMPAT, \'UTF-8\'); 
    
        就国际范围内对国际字符集的支持而言,PHP令人震惊(尽管它逐渐变得越来越好,尤其是在PHP5中,但是您没有指定要使用的版本)。但是,有一些
mb_
(多字节,如多字节字符)功能可以帮助您。 此示例可能会帮助您(从此处开始):
<?php 
/** 
 *  Multibyte equivalent for htmlentities() [lite version :)] 
 * 
 * @param string $str 
 * @param string $encoding 
 * @return string 
 **/ 
function mb_htmlentities($str, $encoding = \'utf-8\') { 
    mb_regex_encoding($encoding); 
    $pattern = array(\'<\', \'>\', \'\"\', \'\\\'\'); 
    $replacement = array(\'&lt;\', \'&gt;\', \'&quot;\', \'&#39;\'); 
    for ($i=0; $i<sizeof($pattern); $i++) { 
        $str = mb_ereg_replace($pattern[$i], $replacement[$i], $str); 
    } 
    return $str; 
} 
?>
另外,请确保您的页面指定了相同的字符集。您可以使用meta标签执行此操作:
<meta http-equiv=\"Content-Type\" content=\"text/html; charset=utf-8\">
    
        您很可能没有使用正确的编码。如果您已经知道输出编码,请使用
html_entities
函数的
charset
参数。 如果尚未确定内部编码,请看一下iconv函数;
iconv_set_encoding(\"internal_encoding\", \"UTF-8\");
可能是一个好的开始。     

要回复问题请先登录注册