如何通过标准化版本的字符串匹配拉丁语而不是拉丁字符?

时间:2016-08-01 16:50:09

标签: ruby regex

如何通过Bartlomiej Zolc找到拉丁语版本的字符串? 我目前的版本仅与英文版匹配。

regex101

/Bartlomiej Zolc/g

hello Bartłomiej Żółć match me!
hello Bartlomiej Zolc match me too!

1 个答案:

答案 0 :(得分:0)

将您匹配的内容标准化可能非常困难,因此我建议您更改正则表达式。

我不知道Ruby是否支持[=o=](匹配o及其所有重音版本)POSIX bracket expression syntax,但还有另一种方式。

将每个字母替换为带有字符类的替代重音形式。例如:

/Bart[lł]omiej [ZŻ][oó][lł][cć]/g