<li>Jain R.K. and Iyengar S.R.K., “Advanced Engineering Mathematicsâ€, Narosa Publications,</li>
我在数据库中有很多原始html字符串。所有文字都有这些奇怪的字符。我如何转换为普通文本以将其保存回数据库中。
$final = '<li>Jain R.K. and Iyengar S.R.K., “Advanced Engineering Mathematicsâ€, Narosa Publications,</li>';
$final = utf8_encode($final);
$final = htmlspecialchars_decode($final);
$final = html_entity_decode($final, ENT_QUOTES, "UTF-8");
$final = utf8_decode($final);
echo $final;
我尝试了上面的代码,它在网络浏览器中正确显示,但仍然在数据库中保存了相同的奇怪字符。
数据库的字符集是utf-8
答案 0 :(得分:2)
“
是&#34; Mojibake&#34;为“
。您可以尝试避免使用非ascii引号,但这只会延迟重新陷入麻烦。
您需要在表和连接中使用utf8mb4
。有关Mojibake的可能原因,请参阅this。
答案 1 :(得分:1)
$final = '<li>Jain R.K. and Iyengar S.R.K., “Advanced Engineering Mathematicsâ€, Narosa Publications,</li>';
$final = str_replace("Â", "", $final);
$final = str_replace("’", "'", $final);
$final = str_replace("“", '"', $final);
$final = str_replace('–', '-', $final);
$final = str_replace('â€', '"', $final);
对于过去的数据,我用UTF-8字符替换了奇怪的字符。
对于未来的数据,我在php,html和数据库连接中为utf8制作了字符集。
答案 2 :(得分:1)
使用 ftfy 工具更安全地修复文本https://ftfy.readthedocs.io/en/latest/