Google Merchant Feed双重编码的UTF-8错误

时间:2015-10-16 14:33:59

标签: encoding utf-8 rss2

我在Google Merchant Center上收到有关数据Feed的错误消息:

  

属性“title”中的双重编码UTF8

但是Feed中有1914个项目,这个错误只发生在58个项目上,所以我猜整个Feed的编码是正确的,但必须有一些错误的字符,但我无法识别它。错误的标题(捷克语):

  • Plášť专业快速Trak运动轮胎650Bx2.0
  • Plášť专业地面控制2Br轮胎650Bx2.3
  • Plášť专业快速Trak运动轮胎29X2.0
  • Plášť专业轮胎16X2.125
  • Plášť专业Fatboy轮胎29X1.7 / 700X45C

当我显示Feed的源代码时,一切似乎都很好:

<title>Plášť Specialized Fast Trak Sport Tire 650Bx2.0</title>

此类其他标题已正确导入:

<title>Plášť Turbo Elite Tire 700X23C</title>

我不知道这些标题有什么问题,或许650Bx2等部分被Google解释为某种UTF-8字符?

2 个答案:

答案 0 :(得分:0)

我找到了一个解决方案 - 问题是char“ť”(带有变音符号),我用char“t”替换所有出现的char,并且接受了XML提要。

答案 1 :(得分:0)

在Google商人中变音符号帮助我的是对多字节字符进行html编码。在您的情况下,可以将ť替换为&#x165;,而不是:

<title>Plášť Specialized Fast Trak Sport Tire 650Bx2.0</title>

您将拥有:

<title>Pl&#xE1;&#x161;&#x165; Specialized Fast Trak Sport Tire 650Bx2.0</title>

我不确定为什么在某些情况下可以不逃避,而在某些情况下却无法逃避。转义的内容一直对我有用。