标签: python nlp soundex
我正在处理一些拉丁文字,并且注意到在写同一个单词时存在很多变体,例如marcij或martij或martii进行曲。我当时以为我应该使用Soundex或双重音素。但是他们为拉丁语工作吗?什么是这种情况下最好的库?谢谢