我从link
中读到了以下句子内容作者需要了解如何声明字符编码 用于他们正在使用的文档格式。
请注意,只是在页面中声明不同的编码不会 改变字节; 您还需要保存该编码中的文字。
据我所知,文本中的字符作为一个或多个字节存储在计算机中,与网页中指定的“字符编码”无关。
我也理解上面引用的文字,除了粗体字的最后一句
您还需要保存该编码中的文字
答案 0 :(得分:0)
当您在最基本的意义上公开提供网页时,您会创建一个文本文件(位于您拥有的硬件上),因为在请求某个地址时您会返回此文件。
该文件可以保存在您的本地硬件上,或者可能不会保存在那里(动态内容)。无论如何,访问您网页的用户都会收到一个文件。一旦用户获得了文件的副本,他就应该能够读取它,这就是编码发挥作用的地方。如果您有一个原始二进制文件,您只能猜测它包含的内容以及它所包含的编码,因此大多数网页都提供了将文件与文件一起返回的编码。
这是您询问的粗体文本可以与我的答案相关的地方 - 如果您在文件旁边提供一个编码(例如utf 8)但是以另一种编码(ASCII)提供文件用户可能会看到部分文字或根本看不到。如果你提供一个静态文件,它应该以正确的编码保存(即你告诉你的文件所在的编码)。
至于如何存储它的问题 - 这与您提供文件的方式非常相关。大多数文本编辑器提供了以特定编码保存文件的方法。大多数用于调出页面内容的工具都提供了方便的方式,以便于用户解码的形式提供文件。
答案 1 :(得分:0)
这只是一个注释,可能是因为一些用户的混淆。
该文本告诉我们,应该以某种形式指定文件的编码。这很简单。 Web服务器通常无法知道文件的编码。请注意,如果页面是由例如一个数据库,编码可能是隐式的,但是web认为文件是一等公民,所以我们仍然需要指定编码。
该注释只是通过更改编码来清除,webrowser不会对页面进行转码。页面将保持每字节字节相同,只是客户端(浏览器)会误解内容。因此,如果要更改编码,则应指定新编码,还要将文件(或保存并转换)保存为预期编码。网络服务器(通常)不会做任何魔术。
答案 2 :(得分:0)
没有文字,只有编码文字。
字符编码的基本规则是读者必须使用与编写者相同的编码。这需要沟通,惯例,规范或标准来建立协议。
“是说内容作者/开发人员必须在他/她指定的编码中手动保存相同的文本(已经存储在计算机中作为一个或多个字节)?如果是,如何这样做以及为什么需要这样做?“
是的,每个文本文件都选择了字符编码。显然,如果文件已经存在,最好不要更改编码。您可以通过某些编辑器选项(尝试另存为...对话框或等效选项)或某些库属性或配置来执行此操作。
“也保存该编码中的文字”
实际上,它通常是相反的方式。您决定要使用或需要使用的编码,HTML编辑器或库使用匹配的声明和任何新的必要字符实体引用更新内容(例如,确实需要写为🚲?是否需要在写入或流式传输文档时写成& iexcl;?)。 (如果你的编辑没有这样做,那就得到一个真正的HTML编辑器。)