由法语字符引起的XML中的文本错误无效

时间:2014-05-21 20:34:00

标签: xml

我收到了一个包含法语字符的XML文件,并收到以下错误:“在文本内容XML中找到了无效字符。”在搜索之后,似乎这是由XML设计用于UTF-8编码的事实引起的常见错误。我不熟悉如何更改正在使用的编码,虽然我在这里看到包含说明编码的行的示例,但我文件中的唯一非数据行是:

<tag> xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"xmlns:xsd="http://www.w3.org/2001/XMLSchema">

有没有办法让这些字符被正确解释?我试图将一个XML文件导入Access,最后,如果我能保留这些字符,那将是最好的。

2 个答案:

答案 0 :(得分:2)

XML默认使用UTF-8编码,但声明不同的编码非常容易 - 比试图改变文档的编码更容易。

如果您使用prolog

启动XML文档
<?xml version="1.0" encoding="ISO-8859-1" ?>

您将告诉XML解析器不要使用UTF-8,而是使用ISO Latin1(这是您的文档实际使用的最可能的编码。)您的角色将以这种方式保留(始终假设Access尊重编码声明,它应该。)

答案 1 :(得分:0)

您可以通过定义文件的标头值来设置XML编码,如下所示:

<?xml version="1.0" encoding="iso-8859-1"?>