您可能知道,在拉丁字母表中,u / v和i / j之间没有区别。将这些字母分开是一个非常晚的传统,许多拉丁文本没有这样的分离。 按照这个传统,我决定让我的小词典的用户找到无视u / v和i / j字母的单词。例如,通过输入'佐剂','adiuvo','佐佐'等,用户将获得相同的结果。达到此目的的最佳途径是什么?例如,我有一个单词列表。如何让所有使Python不与u / v和i / j不同的单词?非常感谢!
答案 0 :(得分:6)
在匹配之前规范化字符串。将所有v替换为u,将所有j替换为i。在字典中,存储从每个规范形式到所有匹配的非规范形式的映射。