R中的西里尔音译

时间:2018-02-02 03:44:37

标签: r transliteration

R中是否有针对拉丁语的西里尔语文本音译?我需要将数据帧转换为拉丁语以使用因子。在R中使用西里尔因子有些麻烦。

3 个答案:

答案 0 :(得分:2)

我终于找到了包裹。

> library(stringi)
> stri_trans_general("женщина", "cyrillic-latin")

[1]“ženŝina”

> stri_trans_general("женщина", "russian-latin/bgn")

[1]“zhenshchina”

之后,剩下的唯一问题是“ё”字母。

> stri_trans_general("Ёж", "russian-latin/bgn")

[1]“Yëzh”

我不得不删除所有“ё”字母

> iconv(stri_trans_general("ёж", "russian-latin/bgn"),from="UTF8",to="ASCII",sub="")

[1]“yzh”

答案 1 :(得分:1)

对于塞尔维亚拉丁语,可以使用上述字符串包,但使用不同的转换标识符来实现:

`stri_trans_general("жшчћђ", "Serbian-Latin/BGN")`

所有字符都应正确转换为塞尔维亚拉丁语。

答案 2 :(得分:1)

如果此后使用 Base R 过滤西里尔字母数据,则一键获取所有 NA ,但是如果使用 dplyr ,则一切精细。