为什么" lay'"变成" layaposs"?

时间:2014-12-01 17:01:58

标签: ruby string unicode character-encoding

我正在为我当地的超市购买电子商务网站。

在品牌“Lay's”上过滤产品时,网址会将其显示为“layaposs”。这应该归一化为“奠定”。

我想知道为什么会这样,我如何用Ruby重现它?

1 个答案:

答案 0 :(得分:3)

听起来有两个过滤器就是这样:

  1. lay's => lay& s(这将'转变为XML实体,')。其他实体包括& for&,< for<,> for>和" for for。
  2. 剥离所有非字母字符,留下你的layaposs。
  3. 我曾经有一个网站把我的姓改成Jesteroemminusy。说真的,不开玩笑。基本上,我姓氏中的连字符变成了“oemminus”,然后我的姓氏的其余部分在Y之后被截断了。