如何显示单词之间的详细距离。 例如,程序的输出可能是:
Words are "car" and "cure":
Replace "a" with "u".
Add "e".
Levenshtein距离不符合我的需要(我认为)。
答案 0 :(得分:1)
尝试以下方法。该算法大致遵循Wikipedia (Levenshtein distance)。下面使用的语言是 ruby
例如,将s
更改为t
的情况如下:
s = 'Sunday'
t = 'Saturday'
首先,将s
和t
转换为数组,并在开头插入一个空字符串。 m
最终将成为算法中使用的矩阵。
s = ['', *s.split('')]
t = ['', *t.split('')]
m = Array.new(s.length){[]}
然而, m
与维基百科中的算法给出的矩阵不同,因为每个单元格不仅包括 Levenshtein距离,而且还包含(非)操作(开始,什么都不做,删除,插入或替换)用于从相邻(左,上或左上)单元格到达该单元格。它还可能包含描述操作参数的字符串。也就是说,每个单元格的格式为:
[Levenshtein距离,操作(,字符串)]
这是主要例程。它按照算法填写m
的单元格:
s.each_with_index{|a, i| t.each_with_index{|b, j|
m[i][j] =
if i.zero?
[j, "started"]
elsif j.zero?
[i, "started"]
elsif a == b
[m[i-1][j-1][0], "did nothing"]
else
del, ins, subs = m[i-1][j][0], m[i][j-1][0], m[i-1][j-1][0]
case [del, ins, subs].min
when del
[del+1, "deleted", "'#{a}' at position #{i-1}"]
when ins
[ins+1, "inserted", "'#{b}' at position #{j-1}"]
when subs
[subs+1, "substituted", "'#{a}' at position #{i-1} with '#{b}'"]
end
end
}}
现在,我们将i
,j
设置到m
的右下角,然后按照步骤向后移动,因为我们将单元格的内容卸载到名为{{1直到我们到达开始。
steps
然后我们打印每个步骤的操作和字符串,除非这是非操作。
i, j = s.length-1, t.length-1
steps = []
loop do
case m[i][j][1]
when "started"
break
when "did nothing", "substituted"
steps.unshift(m[i-=1][j-=1])
when "deleted"
steps.unshift(m[i-=1][j])
when "inserted"
steps.unshift(m[i][j-=1])
end
end
通过这个特定的例子,它将输出:
steps.each do |d, op, str=''|
puts "#{op} #{str}" unless op == "did nothing" or op == "started"
end
答案 1 :(得分:0)
class Solution:
def solve(self, text, word0, word1):
word_list = text.split()
ans = len(word_list)
L = None
for R in range(len(word_list)):
if word_list[R] == word0 or word_list[R] == word1:
if L is not None and word_list[R] != word_list[L]:
ans = min(ans, R - L - 1)
L = R
return -1 if ans == len(word_list) else ans
ob = Solution()
text = "cat dog abcd dog cat cat abcd dog wxyz"
word0 = "abcd"
word1 = "wxyz"
print(ob.solve(text, word0, word1))