我正在尝试从其他网站获取瑞典语内容。我能够获取数据,但瑞典字符(ÅÖÄ)丢失了。直接添加的瑞典语内容没有显示问题,因为我添加了元标记。问题是当我试图显示来自另一个站点的数据时。是否可以解决此问题。我没有任何访问其他网站的权限。
答案 0 :(得分:2)
要考虑瑞典语字符,您需要将charset
设置为UTF-8
。 MDN的一个例子是:
<!-- In HTML5 -->
<meta charset="utf-8">
<!-- Defining the charset in HTML4 -->
<!-- Note: This is invalid in HTML5 -->
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
元标记位于<head>
标记中,如下所示:
<html>
<head>
<meta charset="UTF-8">
</head>
</html>
引用MDN:
[charset]声明页面使用的字符编码。可以使用任何元素上的lang属性在本地覆盖它。这个 attribute是文字字符串,必须是首选MIME之一 IANA定义的字符编码的名称。虽然 标准没有请求特定的字符编码,它给出了一些 建议:
- 鼓励作者使用UTF-8。
- 作者不应使用ASCII不兼容的编码(即那些不将8位代码点0x20到0x7E映射到Unicode的编码 0x0020到0x007E代码点)因为这些代表了安全风险: 不支持它们的浏览器可能将良性内容解释为HTML 元素。这至少是以下字符集的情况: JIS_C6226-1983,JIS_X0212-1990,HZ-GB-2312,JOHAB,ISO-2022 家庭和EBCDIC家庭。
- 作者不得使用CESU-8,UTF-7,BOCU-1和SCSU,这些也属于该类别,不打算在网上使用。 使用其中一些编码的跨脚本攻击已经存在 记录。
- 作者不应使用UTF-32,因为并非所有HTML5编码算法都能将其与UTF-16区分开来。
Here也是UTF-8上的链接。
*注意:如果由于某些原因UTF-8
编码对您的角色无效,请尝试charset="ISO-8859-1"