我将遗留数据库导入SQLite,其中包含许多包含URL编码字符串的字段。遗留数据库是使用latin1编码设置的,它有很多像这样编码的波兰字符
“B%26%23322%3Bad + zapisu +%2D + powinno +由%26%23263%3B + BRAK”
在CGI :: unescape之后给出
“bł ad zapisu - powinno być brak”
我尝试在字符串上强制执行ISO-8859-1和cp1250以将它们编码为UTF-8,但没有成功:我仍然以转义波兰字符结束。我已经研究了两天了,但仍然无法找到解决方案。你能帮帮我吗?
答案 0 :(得分:4)
它与UTF-8编码无关,因为它是HTML编码。你需要这样做
CGI::unescapeHTML(CGI::unescape("b%26%23322%3Bad+zapisu+%2D+powinno+by%26%23263%3B+brak"))