我正在设计一个API,它将URL作为输入,并读取该URL的内容。当URL是“file:”协议时,什么会为字符编码提供更好的默认值?
API允许明确设置。此外,我们可以使用一些启发式方法来确定字符编码,例如BOM(如果可用),但是当所有这些都失败时,应该是什么默认值?
据我所知,标准在这个问题上没有提及。在其他条件相同的情况下,对于甚至不知道存在字符编码等问题的人来说,我希望最常出现这种情况。
答案 0 :(得分:2)
如果可能,请始终使用UTF-8,并在API文档中记录。 UTF-8是一个坚如磐石的标准编码和未来的证明 - 我会通过支持其他编码避免为自己创造潜在的工作 - 如果你迁移API以便以这样的方式使用UTF-8将很容易使用它可以通过Web服务访问。