什么应该是使用file:protocol从URL读取的API的默认编码?

时间:2012-02-07 17:32:29

标签: file url character-encoding api-design

我正在设计一个API,它将URL作为输入,并读取该URL的内容。当URL是“file:”协议时,什么会为字符编码提供更好的默认值?

  • 系统的原生编码
  • UTF-8

API允许明确设置。此外,我们可以使用一些启发式方法来确定字符编码,例如BOM(如果可用),但是当所有这些都失败时,应该是什么默认值?

据我所知,标准在这个问题上没有提及。在其他条件相同的情况下,对于甚至不知道存在字符编码等问题的人来说,我希望最常出现这种情况。

1 个答案:

答案 0 :(得分:2)

如果可能,请始终使用UTF-8,并在API文档中记录。 UTF-8是一个坚如磐石的标准编码和未来的证明 - 我会通过支持其他编码避免为自己创造潜在的工作 - 如果你迁移API以便以这样的方式使用UTF-8将很容易使用它可以通过Web服务访问。