如何替换utf8_general_ci上的所有无效字符?
对于没有问题的mysql插入,如果用户可以放入emojis或其他misc。字符,但保持所有兼容的字符(a-Z,数字,字符,引号,俄文,日文...)
感谢。
答案 0 :(得分:0)
在PHP中,您可以使用函数Import tweepy
consumer_key = ""
consumer_secret = ""
access_key = ""
access_secret = ""
auth = tweepy.OAuthHandler(consumer_key, consumer_secret)
auth.set_access_token(access_key, access_secret)
api = tweepy.API(auth)` # This is authentication process.
new_tweets = api.user_timeline(screen_name ='ABCD',count=20) # Code to download 20 timelines for user 'ABCD'
来确保只有有效的字符在提供的字符串中。
注意:在MySQL 5.5.3及更高版本中使用utf8mb4,而不是utf8,它是具有相同性能的相同UTF-8数据格式,但删除了特定于MySQL的限制,其中仅支持最多xFFFD的字符。
如果您需要更多灵活性或其他字符集,请查看utf8_encode()
。它不再维护,但至少charsets的变化是罕见的; - )
答案 1 :(得分:0)
请注意,utf8_encode仅将ISO-8859-1中编码的字符串转换为UTF-8。一个更合适的名称是" iso88591_to_utf8"。如果您的文本未在ISO-8859-1中编码,则不需要此功能。如果您的文本已经是UTF-8,则不需要此功能。实际上,将此函数应用于未在ISO-8859-1中编码的文本很可能只是简单地将该文本弄乱。
如果您需要将文本从任何编码转换为任何其他编码,请查看iconv()。