我需要从页面上的数据库中提取内容,但其中一些内容包含整个HTML页面 - 包括css,head等...
防止拥有所有htlm标签,脚本,CSS的最佳方法是什么? iframe会帮助吗?
最麻烦的是我在页面上遇到了奇怪的字符: 并且发现它是由于不同的编码。
该网站具有utf-8编码,如果内容包含不同的编码,则会出现这些标志,我无法替换它们。 它使它们删除的唯一方法是改变我的编码,但这不是真正的解决方案。
如果有人能告诉我如何删除它们,那真的很棒。
解决方案:在您帮助下我检查了编码,但无法更改。我将mysql_query中的名称设置为UTF-8,并剥离了unusefull标记。现在好像没问题。 谢谢你们所有人。
答案 0 :(得分:2)
我认为你没有机会分开一个丑陋的iframe。关于编码,您应该检查数据库编码,连接编码并根据需要进行转换。使用iconv
可完全控制转化,例如:
$html=iconv("UTF-8", "ISO-8859-15"."//TRANSLIT//IGNORE",$html]);
在这种情况下,您将丢失一些未在ISO-8859-15中映射的字符。考虑将整个站点移动到UTF-8编码。
答案 1 :(得分:1)
标签实际上可能不是由于编码,问题可能是存储在数据库中的内容。 检查双引号,例如“,应该是”,如果表格中的数据是复制粘贴的话,请更多。