- 认为这称为字符编码,但如果我错了请重新标题 -
问题:尝试使用phpquery使用HTML并在运行phpquery函数后维护html的完整性。
这些是HTML在运行函数时所做的更改:
原始HTML: <strong> Fast & Strong I Concrete</strong>
HTML页面已转换为PHPQueryObject: <strong> Fast& Strong IÂ Concrete</strong>
PHPQueryObject通过Find()函数运行: <strong> Fast & Strong IÂ Concrete</strong>
尝试了htmlentities()
,html_entity_decode()
,iconv()
的各种组合来处理数据的移动并维护原始结构,而不显示一堆不必要的字符。我认为这是phpquery使用html的能力的限制,所以我需要一个解决方法。
我已成功使用iconv("UTF-8", "BIG5//IGNORE")
删除Â和其他不需要的字符,但它对原始html有点破坏性,因为它适用于繁体中文字符。
问题:什么是Â
和
以及如何处理它们,以便上面消费的html#2和#3显示为上面原定的#1而不显示浏览器的额外字符?