perl xml Lib中的XML编码问题

时间:2009-07-06 09:57:06

标签: xml regex perl utf-8

在我执行此操作时使用Perl替换特殊字符。我收到了这个错误。我只是尝试使用XML :: Lib合并2 xml文件。

解析器错误:输入不正确的UTF-8,表示编码!字节:0xA3 0x32 0x33 0x6B 23到c 27。

问题是什么以及如何解决这个问题

  • 我在去XML Parser之前想过,我会替换那些特殊字符。但我不知道如何在perl中实现这一点?或者有没有办法关闭此错误并完成与正确格式的合并

  • 我使用了recover_silently(XML LIb解析器),在问题发生后删除了所有标签

3 个答案:

答案 0 :(得分:3)

您的输入文件未以UTF-8编码。在使用之前将其转换为UTF-8,例如参见此excellent article.

答案 1 :(得分:3)

答案 2 :(得分:2)

<?xml version="1.0" encoding="iso-8859-1"?>

我刚将其添加到XML文件中。然后工作正常