使用unique()和==匹配重音符号和非重音符号

时间:2015-08-12 18:42:12

标签: r unique diacritics accent-insensitive

我正在整理一些看起来几乎相同的表,除了一些字符在某些字符中显示重音而在其他字符中没有重音。例如,“André”有时会读取“Andre”,“Flávio”和“Flavio”等。我需要将所有变体视为相同,但unique()将它们视为不同。我想改变所有重音非重音,然后使用unique(),但我想也许还有另一种更快的选择。

后来我需要使用==进行相同的不区分重音比较,所以我正在考虑从每个表的副本中删除所有重音,并对副本进行比较。请告诉我是否有更好的方法。

1 个答案:

答案 0 :(得分:6)

在比较之前删除重音的方法似乎适合您的目的。请注意,iconv中存在TRANSLIT标记

的此类工具
iconv(c("André","Flávio"),to='ASCII//TRANSLIT')
#> [1] "Andre"  "Flavio"