说我希望匹配字符串“Bogata”。我正在寻找一个正则表达式或一个简短的算法,可以匹配英国化的“Bogata”或正确的“波哥大”,甚至是拼写错误的“Bógatá”。
同样,如果我希望匹配字符串“Sao Paolo”,我希望匹配“Sao Paolo”和“SãoPaolo”。
我的问题是针对javascript和RegExp模块的,但更通用的解决方案更可取
答案 0 :(得分:1)
USENET线程archived by Google Groups讨论了在正则表达式扩展中支持Unicode所涉及的一些问题。在那里,Thomas' PointedEars'拉恩提到了他的版本,jsx.regexp,我从来没有深入分析,但表面看起来相当不错。它可能对你有用。