字母表转换 - 西里尔语到拉丁语

时间:2017-05-09 12:28:27

标签: r text-mining stringr

我有一份用西里尔文写的名字和姓氏清单。

head(text, n = 20)
   unique(clients$RODITEL)
1                     <NA>
2                    ЃОРЃИ
3               ALEKSANDAR
4             000000000000
5                  ТР4АЈЧЕ
6                        0
7                  HHHHHHH
8                  0000000
9                    TASKO
10    --------------------
11                   ДРАГИ
12                  СЛАВЧО
13                     ACO
14                  НИКОЛА
15                    САШО
16                  НАУМЧЕ
17                    ОРЦЕ
18                  САНДРА
19                  МИРСАД
20                   ОКТАЈ

我需要做的是将Cyrlic上写的名称(例如最后10行)转换为拉丁语。

所以输出结果为:

1                     <NA>
2                    GJORGJI
3               ALEKSANDAR
4             000000000000
5                  TRAJCHE
6                        0
7                  HHHHHHH
8                  0000000
9                    TASKO
10    --------------------
11                   DRAGI
12                  SLAVCHO
13                     ACO
14                  NIKOLA
15                    SASHO
16                  NAUMCHE
17                    ORCE
18                  SANDRA
19                  MIRSAD
20                   OKTAJ

特别的,Cyrlic字母表是马其顿语。

我不确定是否有任何R套餐可以处理此类转化?

1 个答案:

答案 0 :(得分:3)

您可以使用包stringi中的功能,例如:

> stri_trans_general('ДРАГИ', 'latin')
[1] "DRAGI"