在一个旧数据库中,我们有HTML字符引用,例如:展览
如何将它们转换为有效的UTF8字符(展览
- > 展览
)?
我知道,例如PHP函数html_entity_decode
执行此操作,但数据量很大,以便将此传递回来,第四次传递给PHP
通过regexp匹配所有,转换为int然后转换为代码点?有可能吗?
答案 0 :(得分:0)
正如Joop Eggen所说,我会对你需要转换的表进行转储,然后我会用bash程序转换文件重新编码
示例:
将db转储到mydb.sql文件
mysqldump -uroot -p mydb > mydb.sql
将html实体转换为utf8
recode html..utf8 mydb.sql
现在转换mydb.sql