我们的应用程序以TBX格式处理文件,这是一个XML文件。我们注意到第三方应用程序在子元素的值(即EF BB BF
)中添加了UTF-8 BOM字符(<term>[BOM]Value text</term>
)。
我认为BOM字符只是用在文件的开头,表示整个文件的编码。
将[BOM]字符放置在XML文件中是正确的还是我们认为该文件已损坏?
如果根据XML规范放置是正确的,我们应该将[BOM]字符视为:
a)元素的部分文本价值
OR
b)对所讨论元素的编码的临时指示(并且仅针对该元素及其子元素)