可以使用xsltproc来解析非UTF 8 xml文件

时间:2009-07-16 12:57:57

标签: bash xslt

我编写了一个bash shell脚本,它读取一个目录并在for循环中解析其中的所有XML文件。我正在获取每个XML文件并将其与xsl样式表一起提供给xsltproc。问题是某些xml文件具有非UTF 8字符,并且解析器无法打开这些文件。抛出分析器错误,表示期望使用UTF 8编码。

有没有可用的选项,我可以指示我的xsltproc处理这些文件。

还有一个选择是,有什么方法可以让我的xsl只读取我想要的标签,而不是整个xml文件?这是xsl的工作方式还是我可能错了

请帮帮我

1 个答案:

答案 0 :(得分:1)

如果您可以识别非UTF-8文件并知道它们所在的编码,那么使用

处理这些文件
iconv -f [encoding] -t UTF-8 < [file] | xsltproc ...

而不是裸xsltproc调用应该做ya。