我正在整理一些看起来几乎相同的表,除了一些字符在某些字符中显示重音而在其他字符中没有重音。例如,“André”有时会读取“Andre”,“Flávio”和“Flavio”等。我需要将所有变体视为相同,但unique()将它们视为不同。我想改变所有重音非重音,然后使用unique(),但我想也许还有另一种更快的选择。
后来我需要使用==进行相同的不区分重音比较,所以我正在考虑从每个表的副本中删除所有重音,并对副本进行比较。请告诉我是否有更好的方法。
答案 0 :(得分:6)
在比较之前删除重音的方法似乎适合您的目的。请注意,iconv
中存在TRANSLIT
标记
iconv(c("André","Flávio"),to='ASCII//TRANSLIT')
#> [1] "Andre" "Flavio"