如何将.csv文件中的“СвÐμÑ€'...”数据格式(俄罗斯地区名称)解码为R中的英文?

时间:2018-04-27 19:29:22

标签: r machine-learning decode decoding string-decoding

我正在研究机器学习项目。当我下载.csv文件时,某些功能的值为未知格式。像СвердловÑÐºÐ°Ñ Ð¾Ð±Ð»Ð°ÑтьЛичные вещÐ之类的东西。这些代表了俄罗斯地区的名称。谁能告诉我如何将它们转换成R中的平面英语?我尝试了以下操作:

df <- read.csv(file.choose(), sep = ',', header = TRUE, encoding = "russian", 
stringsAsFactors = FALSE)

不起作用

数据样本:

| region | City |
|---|---|
| ÐижегородÑÐºÐ°Ñ Ð¾Ð±Ð»Ð°ÑÑ‚ÑŒ | КраÑнодар |
| ВоронежÑÐºÐ°Ñ Ð¾Ð±Ð»Ð°ÑÑ‚ÑŒ | ЧелÑбинÑк |
| ÐижегородÑÐºÐ°Ñ Ð¾Ð±Ð»Ð°ÑÑ‚ÑŒ | Воронеж |
| ÐижегородÑÐºÐ°Ñ Ð¾Ð±Ð»Ð°ÑÑ‚ÑŒ | КраÑнодар |
| КраÑноÑÑ€Ñкий край | Самара |
| РоÑтовÑÐºÐ°Ñ Ð¾Ð±Ð»Ð°ÑÑ‚ÑŒ | Тюмень |

0 个答案:

没有答案