从twitter趋势中删除特殊字符

时间:2012-12-13 10:16:31

标签: php twitter

我需要从twitter趋势中删除特殊字符。因为趋势用于形成类似http://example.com/trends/trending-topic的网址。

如果有任何特殊字符,例如Gävle,它将形成丑陋的网址。我该如何删除这些字符。趋势中是否有允许的字符列表?

1 个答案:

答案 0 :(得分:0)

这是一把双刃剑。

您可以使用iconv()//TRANSLIT//IGNORE功能来尝试将UTF-8字符串转换为较小的字符集,例如US-ASCII。 //TRANSLIT标志将转换任何可以转换为目标字符集中的敏感字符的字符。 //IGNORE会阻止iconv在音译或原始编码出错时停止。

请注意,无法音译的字符将被删除。目标字符集越接近来源的字符就越好。例如,许多欧洲语言可以毫无问题地音译到US-ASCII,但是尝试移植诸如西里尔语之类的东西或来自亚洲大陆的东西将成为一个火车残骸。这就是双刃剑的用武之地。在URL中编码UTF可能在视觉上很丑陋,但最有可能长期为你服务。