R中是否有针对拉丁语的西里尔语文本音译?我需要将数据帧转换为拉丁语以使用因子。在R中使用西里尔因子有些麻烦。
答案 0 :(得分:2)
我终于找到了包裹。
> library(stringi)
> stri_trans_general("женщина", "cyrillic-latin")
[1]“ženŝina”
> stri_trans_general("женщина", "russian-latin/bgn")
[1]“zhenshchina”
之后,剩下的唯一问题是“ё”字母。
> stri_trans_general("Ёж", "russian-latin/bgn")
[1]“Yëzh”
我不得不删除所有“ё”字母
> iconv(stri_trans_general("ёж", "russian-latin/bgn"),from="UTF8",to="ASCII",sub="")
[1]“yzh”
答案 1 :(得分:1)
对于塞尔维亚拉丁语,可以使用上述字符串包,但使用不同的转换标识符来实现:
`stri_trans_general("жшчћђ", "Serbian-Latin/BGN")`
所有字符都应正确转换为塞尔维亚拉丁语。
答案 2 :(得分:1)
如果此后使用 Base R 过滤西里尔字母数据,则一键获取所有 NA ,但是如果使用 dplyr ,则一切精细。