处理HTML字符编码问题

时间:2011-08-11 15:53:32

标签: html encoding iconv phpquery

- 认为这称为字符编码,但如果我错了请重新标题 -

问题:尝试使用phpquery使用HTML并在运行phpquery函数后维护html的完整性。

这些是HTML在运行函数时所做的更改:

  1. 原始HTML: <strong> Fast & Strong I Concrete</strong>

  2. HTML页面已转换为PHPQueryObject: <strong> Fast& Strong I&Acirc;&nbsp;Concrete</strong>

  3. PHPQueryObject通过Find()函数运行: <strong> Fast & Strong IÂ Concrete</strong>

  4. 尝试了htmlentities()html_entity_decode()iconv()的各种组合来处理数据的移动并维护原始结构,而不显示一堆不必要的字符。我认为这是phpquery使用html的能力的限制,所以我需要一个解决方法。

    我已成功使用iconv("UTF-8", "BIG5//IGNORE")删除Â和其他不需要的字符,但它对原始html有点破坏性,因为它适用于繁体中文字符。

    问题:什么是&Acirc;&nbsp;以及如何处理它们,以便上面消费的html#2和#3显示为上面原定的#1而不显示浏览器的额外字符?

0 个答案:

没有答案