我收到了一个包含法语字符的XML文件,并收到以下错误:“在文本内容XML中找到了无效字符。”在搜索之后,似乎这是由XML设计用于UTF-8编码的事实引起的常见错误。我不熟悉如何更改正在使用的编码,虽然我在这里看到包含说明编码的行的示例,但我文件中的唯一非数据行是:
<tag> xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"xmlns:xsd="http://www.w3.org/2001/XMLSchema">
有没有办法让这些字符被正确解释?我试图将一个XML文件导入Access,最后,如果我能保留这些字符,那将是最好的。
答案 0 :(得分:2)
XML默认使用UTF-8编码,但声明不同的编码非常容易 - 比试图改变文档的编码更容易。
如果您使用prolog
启动XML文档<?xml version="1.0" encoding="ISO-8859-1" ?>
您将告诉XML解析器不要使用UTF-8,而是使用ISO Latin1(这是您的文档实际使用的最可能的编码。)您的角色将以这种方式保留(始终假设Access尊重编码声明,它应该。)
答案 1 :(得分:0)
您可以通过定义文件的标头值来设置XML编码,如下所示:
<?xml version="1.0" encoding="iso-8859-1"?>