将重音字符转换为ascii字符

时间:2012-11-28 16:54:33

标签: r transliteration

从1600万个字符串变量的向量中删除德语(或法语)重音的最佳方法是什么。

例如,'Sjögren综合征'进入'斯耶格伦综合征'

将单个字符转换为单个字符比音译更好,例如

ä=> aeö=> oeü=> UE。

例如,使用正则表达式将是一个选项,但有更好的东西(R包为此)?

gsub('ü','u',gsub('ö','o',"Sjögren's syndrome ( über) "))

非R平台有SO解决方案,但对R来说不是很好。

2 个答案:

答案 0 :(得分:24)

使用iconv转换为带音译的ASCII(如果支持):

iconv(c("über","Sjögren's"),to="ASCII//TRANSLIT")
[1] "uber"      "Sjogren's"

答案 1 :(得分:20)

其中一个相关答案显示

<div class="dropdown hidden-md hidden-lg">