将“болно”转换为西里尔语

时间:2016-04-13 21:22:11

标签: unicode encoding character-encoding character cyrillic

我的数据库中存在一些问题,其中一些西里尔文本看起来像"болно Ð±Ð°Ñ Ð°Ð¼ÑŒÐ´Ñ€ÑƒÑƒÐ»Ð¶ ч Ð"。有没有办法将其转换回人类可读的格式。

我需要阅读这个的实际背景。

1 个答案:

答案 0 :(得分:2)

我可以从您的数据中做到最好......它看起来像西里尔语,但谷歌翻译并没有做任何事情。它似乎是在默认的美国Windows编解码器下解码但是真的是UTF-8,但数据并不完全正确。我正在使用Python来尝试修复它:

(02)[\/.]29[\/.](((18|19|20)(04|08|[2468][048]|[13579][26]))|2000)