如何替换utf8_general_ci上的所有无效字符

时间:2016-06-10 09:49:38

标签: php mysql

如何替换utf8_general_ci上的所有无效字符?

对于没有问题的mysql插入,如果用户可以放入emojis或其他misc。字符,但保持所有兼容的字符(a-Z,数字,字符,引号,俄文,日文...)

感谢。

2 个答案:

答案 0 :(得分:0)

在PHP中,您可以使用函数Import tweepy consumer_key = "" consumer_secret = "" access_key = "" access_secret = "" auth = tweepy.OAuthHandler(consumer_key, consumer_secret) auth.set_access_token(access_key, access_secret) api = tweepy.API(auth)` # This is authentication process. new_tweets = api.user_timeline(screen_name ='ABCD',count=20) # Code to download 20 timelines for user 'ABCD' 来确保只有有效的字符在提供的字符串中。

注意:在MySQL 5.5.3及更高版本中使用utf8mb4,而不是utf8,它是具有相同性能的相同UTF-8数据格式,但删除了特定于MySQL的限制,其中仅支持最多xFFFD的字符。

如果您需要更多灵活性或其他字符集,请查看utf8_encode()。它不再维护,但至少charsets的变化是罕见的; - )

答案 1 :(得分:0)

请注意,utf8_encode仅将ISO-8859-1中编码的字符串转换为UTF-8。一个更合适的名称是" iso88591_to_utf8"。如果您的文本未在ISO-8859-1中编码,则不需要此功能。如果您的文本已经是UTF-8,则不需要此功能。实际上,将此函数应用于未在ISO-8859-1中编码的文本很可能只是简单地将该文本弄乱。

如果您需要将文本从任何编码转换为任何其他编码,请查看iconv()。