规范化R

时间:2018-04-29 20:30:03

标签: r

我有一个像这样的俄罗斯地区和城市的数据框。

    >df                                                                                                                                                    
    russian_region
1          <U+0421><U+0432><U+0435><U+0440><U+0434><U+043B><U+043E><U+0432><U+0441><U+043A><U+0430><U+044F> <U+043E><U+0431><U+043B><U+0430><U+0441><U+0442><U+044C>
2                                  <U+0421><U+0430><U+043C><U+0430><U+0440><U+0441><U+043A><U+0430><U+044F> <U+043E><U+0431><U+043B><U+0430><U+0441><U+0442><U+044C>
3                          <U+0420><U+043E><U+0441><U+0442><U+043E><U+0432><U+0441><U+043A><U+0430><U+044F> <U+043E><U+0431><U+043B><U+0430><U+0441><U+0442><U+044C>
4                                                                                           <U+0422><U+0430><U+0442><U+0430><U+0440><U+0441><U+0442><U+0430><U+043D>
5  <U+0412><U+043E><U+043B><U+0433><U+043E><U+0433><U+0440><U+0430><U+0434><U+0441><U+043A><U+0430><U+044F> <U+043E><U+0431><U+043B><U+0430><U+0441><U+0442><U+044C>
6                                                                                           <U+0422><U+0430><U+0442><U+0430><U+0440><U+0441><U+0442><U+0430><U+043D>
7  <U+041D><U+0438><U+0436><U+0435><U+0433><U+043E><U+0440><U+043E><U+0434><U+0441><U+043A><U+0430><U+044F> <U+043E><U+0431><U+043B><U+0430><U+0441><U+0442><U+044C>
8                                                                  <U+041F><U+0435><U+0440><U+043C><U+0441><U+043A><U+0438><U+0439> <U+043A><U+0440><U+0430><U+0439>
9          <U+041E><U+0440><U+0435><U+043D><U+0431><U+0443><U+0440><U+0433><U+0441><U+043A><U+0430><U+044F> <U+043E><U+0431><U+043B><U+0430><U+0441><U+0442><U+044C>
10 <U+041D><U+0438><U+0436><U+0435><U+0433><U+043E><U+0440><U+043E><U+0434><U+0441><U+043A><U+0430><U+044F> <U+043E><U+0431><U+043B><U+0430><U+0441><U+0442><U+044C>
                                                                                                                russian_city
1                           <U+0415><U+043A><U+0430><U+0442><U+0435><U+0440><U+0438><U+043D><U+0431><U+0443><U+0440><U+0433>
2                                                                           <U+0421><U+0430><U+043C><U+0430><U+0440><U+0430>
3                         <U+0420><U+043E><U+0441><U+0442><U+043E><U+0432>-<U+043D><U+0430>-<U+0414><U+043E><U+043D><U+0443>
4  <U+041D><U+0430><U+0431><U+0435><U+0440><U+0435><U+0436><U+043D><U+044B><U+0435> <U+0427><U+0435><U+043B><U+043D><U+044B>
5                                                   <U+0412><U+043E><U+043B><U+0433><U+043E><U+0433><U+0440><U+0430><U+0434>
6                                                   <U+0427><U+0438><U+0441><U+0442><U+043E><U+043F><U+043E><U+043B><U+044C>
7          <U+041D><U+0438><U+0436><U+043D><U+0438><U+0439> <U+041D><U+043E><U+0432><U+0433><U+043E><U+0440><U+043E><U+0434>
8                                                                                   <U+041F><U+0435><U+0440><U+043C><U+044C>
9                                                           <U+041E><U+0440><U+0435><U+043D><U+0431><U+0443><U+0440><U+0433>
10         <U+041D><U+0438><U+0436><U+043D><U+0438><U+0439> <U+041D><U+043E><U+0432><U+0433><U+043E><U+0440><U+043E><U+0434>

我不知道为什么我会看到上面的UTF-8字符,而当我这样做时

  

DF $ russian_city

,我看到俄文名字

> df$russian_region
 [1] "Свердловская область"  "Самарская область"     "Ростовская область"    "Татарстан"             "Волгоградская область" "Татарстан"             "Нижегородская область" "Пермский край"        
 [9] "Оренбургская область"  "Нижегородская область"

我的环境设置是否有问题,我的R会话无法读取俄语字符,我该如何处理?

1 个答案:

答案 0 :(得分:0)

我在加载数据库时遇到了很多问题。我尝试了this notebook中使用的方法,而且那个方法也没有用。所以我放弃了,只是将语言环境改为俄语,现在一切正常。如果其他答案不起作用,请尝试这个。

Sys.setlocale(category = "LC_ALL", locale = "Russian")