Levenshtein距离除英语之外还有哪些其他语言支持其实施?
我知道语言需要基于单字符的表示(而不是像荷兰语那样将两个或多个字符视为单个实体?),并想知道哪些语言属于/不属于此类别。
由于 Abhishek S
答案 0 :(得分:1)
在数学意义上,Levenshtein距离定义在任意弦上;它不是特定于语言的。您应该确保在正确的表示级别上计算它,合理的默认值是在某些normalization之后的Unicode代码点的级别。如果您正在处理的语言总是需要两个符号来表示任何有意义的符号,那么在符号对上计算Levenshtein距离。
[我不确定你的意思是多个角色是荷兰语中的“单一实体”,但如果你的意思是ij ligature,那从未阻止我将Levenshtein应用于荷兰文:)]