我编写了一个bash shell脚本,它读取一个目录并在for循环中解析其中的所有XML文件。我正在获取每个XML文件并将其与xsl样式表一起提供给xsltproc。问题是某些xml文件具有非UTF 8字符,并且解析器无法打开这些文件。抛出分析器错误,表示期望使用UTF 8编码。
有没有可用的选项,我可以指示我的xsltproc处理这些文件。
还有一个选择是,有什么方法可以让我的xsl只读取我想要的标签,而不是整个xml文件?这是xsl的工作方式还是我可能错了
请帮帮我
答案 0 :(得分:1)
如果您可以识别非UTF-8文件并知道它们所在的编码,那么使用
处理这些文件iconv -f [encoding] -t UTF-8 < [file] | xsltproc ...
而不是裸xsltproc调用应该做ya。