UFT-8或utf-8?在结尾标记处是否有空格? TAB或太空?

时间:2010-11-27 10:33:25

标签: xml formatting

我在想:

  1. 我应该使用utf-8大写或小写以及为什么或在大写的情况下我需要它的情况?

  2. 删除元素的结束空格以节省空间是错误的吗?

    <myElement myAttribute="0" />
    

    <myElement myAttribute="0"/>
    

    考虑到我有200MB到1GB大小的巨大文件

  3. 如果我想节省空间,我应该使用TAB还是SPACE?

2 个答案:

答案 0 :(得分:1)

  1. 哪个背景?
  2. 不,你不能删除那个空格。至少不是如果你想要符合XML 1.0规范。
  3. 一个空格字符和一个制表符字符每个只需要一个字节。四个空格字符需要4个字节,但是一个制表符和一个带有制表符4的编辑器仍然需要一个字节。现在这是你的决定。

答案 1 :(得分:0)

  

<强> 1。我应该使用utf-8大写或小写以及为什么或在大写字母中我需要它的情况?

我认为你指的是XML声明:

<?xml version="1.0" encoding="UTF-8"?>

IANA Character Sets页面说明了这一点:

  

字符集名称最多可包含40个字符   US-ASCII的可打印字符。但是,没有区别   在使用大写和小写字母之间。

因此,我得出结论,encoding="UTF-8"encoding="utf-8"在XML声明中是等效的。

  

<强> 2。删除元素的结束空间以节省空间是错误的吗?

<myElement myAttribute="0" />

<myElement myAttribute="0"/>

<myElement myAttribute></myElement>

这些表达式中的每一个都表示没有内容的元素。它们在语义上都是等价的。在第一个表达式中,/>之前的空格字符不重要。 (虽然经常会看到为样式添加了空格字符。)

  

第3。如果我想节省空间,我应该使用TAB还是SPACE?

在UTF-8编码(以及ASCII)中,TABSPACE各占一个字节。因此,如果您使用多个SPACE字符进行缩进,则用单个SPACE字符替换每组TAB个字符可以节省存储空间(或减少XML文档的大小)网络传输)。