我正在研究机器学习项目。当我下载.csv文件时,某些功能的值为未知格式。像СвердловÑÐºÐ°Ñ Ð¾Ð±Ð»Ð°ÑÑ‚ÑŒ
和Личные вещÐ
之类的东西。这些代表了俄罗斯地区的名称。谁能告诉我如何将它们转换成R中的平面英语?我尝试了以下操作:
df <- read.csv(file.choose(), sep = ',', header = TRUE, encoding = "russian",
stringsAsFactors = FALSE)
不起作用
数据样本:
| region | City |
|---|---|
| ÐижегородÑÐºÐ°Ñ Ð¾Ð±Ð»Ð°ÑÑ‚ÑŒ | КраÑнодар |
| ВоронежÑÐºÐ°Ñ Ð¾Ð±Ð»Ð°ÑÑ‚ÑŒ | ЧелÑбинÑк |
| ÐижегородÑÐºÐ°Ñ Ð¾Ð±Ð»Ð°ÑÑ‚ÑŒ | Воронеж |
| ÐижегородÑÐºÐ°Ñ Ð¾Ð±Ð»Ð°ÑÑ‚ÑŒ | КраÑнодар |
| КраÑноÑÑ€Ñкий край | Самара |
| РоÑтовÑÐºÐ°Ñ Ð¾Ð±Ð»Ð°ÑÑ‚ÑŒ | Тюмень |