URL中的非拉丁字符 - 对它们进行编码或替换为拉丁语“对应”更好吗?

时间:2010-04-29 09:40:06

标签: url utf-8 seo character-encoding

我们正在为支持六种不同语言的网站实施博客,其中五种语言的字母表中包含非拉丁字符。我们不确定是否应该对它们进行编码(这就是我们目前所做的)

Létáníspotravinami:Co je dovoleno?成为 l%c3%a9t%c3%a1n%c3%ad-s-potravinami-co-je-dovoleno 和浏览器将其显示为létání-s-potravinami-co-je-dovoleno

或者我们是否应该用他们的拉丁语“对应物”(类似的字母)替换它们

Létáníspotravinami:Co je dovoleno?成为 letani-s-potravinami-co-je-dovoleno

关于从SEO角度来看哪些更好,我找不到明确的答案?搜索引擎优化对我们来说非常重要。你会建议采用哪种方法?

6 个答案:

答案 0 :(得分:4)

大多数情况下,搜索引擎处理拉丁语的对手很好,尽管有时,"létání""letani"的结果略有不同。

因此,就搜索引擎优化而言,几乎不会造成任何伤害 - 一旦您的网站拥有良好的内容,良好的标记和所有其他内容,您的网站就不会受到拉丁网的影响。

你并不总是知道系统浏览器和插件用户的组合,所以尽可能简单 - 所有网站都在URL中使用标准拉丁语,因为非拉丁语符号可以阻止从服务器到浏览器到任何插件的任何内容这可能会破坏用户的体验。

我不能强调这一点; SEO之前的用户!

答案 1 :(得分:1)

“从SEO的角度看哪有更好”

谁是你的观众?认为所有这些额外信件的美国人都是错误的?

或者那些阅读(和搜索)“非ASCII”字母的人,因为那些非ASCII字母是他们语言的一部分?

搜索引擎优化是一件坏事。完整,正确,一致和可用是您首先要建立的。

答案 2 :(得分:0)

我建议你用那些拉丁语的同行替换它们,因为它是用户友好的,你的网站可以在每台计算机上访问(因为键盘从计算机变为另一台,但所有这些都有拉丁字母),但对于SEO的观点我不认为这会成为一个问题。

答案 3 :(得分:0)

Pawel,首先,您应该决定是否要针对全球Google(google.com)或波兰语进行优化。

答案 4 :(得分:0)

根据URI规范RFC 3986,只允许使用7位ASCII字符,并且必须正确转义规范中提到的控制字符中的字符。如果你想表示其他字符或URI控制字符,那么你应该使用IRI,RFC 3987.但请记住,HTTP与IRI不兼容。

如果对RTFM有疑问。

答案 5 :(得分:0)

另一个问题是,在大多数字体中都有Unicode代码点,其字形看起来非常相似,这绝对是网络钓鱼者的理想选择。坚持ASCII,字符是明显不同的。