我有一个包含XML字符代码的字符串(例如&
,<
等)。我想知道是否有一个模块可以用来自动用实际字符替换这些字符代码。
我知道我可以写一个简单的搜索/替换正则表达式,但是我必须确保我没有遗漏任何字符代码;它似乎是某种现有模块可以处理的事物类型。
谢谢!
答案 0 :(得分:8)
嗯......您的HTML或XML解析器应该为您做到这一点。
对于HTML,您可以使用HTML::Entities。
对于XML,实体定义基于模式和文档本身,因此它必须是XML解析过程的一部分。 XML本身知道的唯一命名实体是&
,<
,>
,'
和"
,但XML文档可以使用任何来自无限范围的实体可能的实体。
答案 1 :(得分:3)
听起来你正在寻找HTML::Entities
的HTML::Parser
。