我有一份用西里尔文写的名字和姓氏清单。
head(text, n = 20)
unique(clients$RODITEL)
1 <NA>
2 ЃОРЃИ
3 ALEKSANDAR
4 000000000000
5 ТР4АЈЧЕ
6 0
7 HHHHHHH
8 0000000
9 TASKO
10 --------------------
11 ДРАГИ
12 СЛАВЧО
13 ACO
14 НИКОЛА
15 САШО
16 НАУМЧЕ
17 ОРЦЕ
18 САНДРА
19 МИРСАД
20 ОКТАЈ
我需要做的是将Cyrlic上写的名称(例如最后10行)转换为拉丁语。
所以输出结果为:
1 <NA>
2 GJORGJI
3 ALEKSANDAR
4 000000000000
5 TRAJCHE
6 0
7 HHHHHHH
8 0000000
9 TASKO
10 --------------------
11 DRAGI
12 SLAVCHO
13 ACO
14 NIKOLA
15 SASHO
16 NAUMCHE
17 ORCE
18 SANDRA
19 MIRSAD
20 OKTAJ
特别的,Cyrlic字母表是马其顿语。
我不确定是否有任何R
套餐可以处理此类转化?
答案 0 :(得分:3)
您可以使用包stringi
中的功能,例如:
> stri_trans_general('ДРАГИ', 'latin')
[1] "DRAGI"