正则表达式匹配对重音不敏感

时间:2014-03-28 19:13:26

标签: javascript regex unicode

说我希望匹配字符串“Bogata”。我正在寻找一个正则表达式或一个简短的算法,可以匹配英国化的“Bogata”或正确的“波哥大”,甚至是拼写错误的“Bógatá”。

同样,如果我希望匹配字符串“Sao Paolo”,我希望匹配“Sao Paolo”和“SãoPaolo”。

我的问题是针对javascript和RegExp模块的,但更通用的解决方案更可取

1 个答案:

答案 0 :(得分:1)

USENET线程archived by Google Groups讨论了在正则表达式扩展中支持Unicode所涉及的一些问题。在那里,Thomas' PointedEars'拉恩提到了他的版本,jsx.regexp,我从来没有深入分析,但表面看起来相当不错。它可能对你有用。