Levenshtein距离是解决这个编辑步骤问题的正确方法吗?

时间:2009-05-30 15:44:09

标签: java levenshtein-distance

我熟悉Levenshtein的距离,所以我决定用它来解决UVA's Edit Steps Ladder problem.

我的解决方案是:

import java.io.*;
import java.util.*;

class LevenshteinParaElJuez implements Runnable{
    static String ReadLn(int maxLength){  // utility function to read from stdin,
                                          // Provided by Programming-challenges, edit for style only
        byte line[] = new byte [maxLength];
        int length = 0;
        int input = -1;
        try{
            while (length < maxLength){//Read untill maxlength
                input = System.in.read();
                if ((input < 0) || (input == '\n')) break; //or untill end of line ninput
                line [length++] += input;
            }

            if ((input < 0) && (length == 0)) return null;  // eof
            return new String(line, 0, length);
         }catch (IOException e){
            return null;
        }
    }

    public static void main(String args[]) // entry point from OS
    {
        LevenshteinParaElJuez myWork = new LevenshteinParaElJuez();  // Construct the bootloader
        myWork.run();            // execute
    }

    public void run() {
        new myStuff().run();
    }
}
class myStuff implements Runnable{
    public void run(){

        ArrayList<String> theWords = new ArrayList<String>();
        try
        {

        /// PLACE YOUR JAVA CODE HERE

        String leido=LevenshteinParaElJuez.ReadLn(100);

        //System.out.println("lo leido fue "+leido);

        while (leido.length() != 0){
        theWords.add(leido);
        leido=LevenshteinParaElJuez.ReadLn(100);
        }


        }catch(Exception e){
            System.out.println("El programa genero una excepcion");
        }


        int maxEdit=0;
        int actualEdit=0;

     int wordsIndex1 =0, wordsIndex2=0;


     while (wordsIndex1<= theWords.size())
     {
      while (wordsIndex2<= theWords.size()-1){
         actualEdit=Levenshtein.computeLevenshteinDistance(theWords.get(wordsIndex1),theWords.get(wordsIndex2));
         if (actualEdit>maxEdit){maxEdit=actualEdit;}
         wordsIndex2++;
      }
     wordsIndex1++;

     }

     System.out.println(maxEdit+1);



    }


}
class Levenshtein {
    private static int minimum(int a, int b, int c) {
        if(a<=b && a<=c)
            return a;
        if(b<=a && b<=c)
            return b;
        return c;
    }

    public static int computeLevenshteinDistance(String str1, String str2) {
        return computeLevenshteinDistance(str1.toCharArray(),
                                          str2.toCharArray());
    }

    private static int computeLevenshteinDistance(char [] str1, char [] str2) {
        int [][]distance = new int[str1.length+1][str2.length+1];

        for(int i=0;i<=str1.length;i++)
                distance[i][0]=i;

        for(int j=0;j<=str2.length;j++)
            distance[0][j]=j;

        for(int i=1;i<=str1.length;i++)
            for(int j=1;j<=str2.length;j++)
                distance[i][j]= minimum(distance[i-1][j]+1,
                                        distance[i][j-1]+1,
                                        distance[i-1][j-1]+
                                        ((str1[i-1]==str2[j-1])?0:1));

        return distance[str1.length][str2.length];
    }


}

使用此输入:

cat
dig
dog
fig
fin
fine
fog
log
wine

它为此样本生成正确的输出:

5

法官拒绝我的回答。这是我第一次尝试解决网上法官的问题,我想我可能会在这里强制给出正确答案:

 System.out.println(maxEdit+1);

因为当使用Levenshtein计算时,maxEdit的值为4。那是怎么回事?

2 个答案:

答案 0 :(得分:2)

Levinshtein是相关的,但不会给你输出中使用的值。在此问题中,使用它来确定两个单词的编辑距离是否恰好为1,表示在编辑步骤梯形图中比较的两个单词是相邻的。

迭代dict中的单词。如果下一个单词与当前单词的编辑距离为1,则可以使其成为当前单词,否则必须跳过该单词。

这个问题的诀窍是找到所有可能的序列 - 只是因为下一个单词的编辑距离为1并不意味着在梯形图中使用它会给你最长的梯子。 / p>

答案 1 :(得分:1)

问题表明您要在字典中找到最长的字典顺序(即字母顺序)序列,以便序列中的每个单词都通过添加,删除或更改一个字母来形成。

因此,样本结果中的5是序列(挖掘,无花果,鳍,精细,葡萄酒)。

我不认为Levenshtein与这个问题特别相关,尽管我可能不够富有想象力。 Levenshtein没有捕捉到每个步骤必须在字典中,后来在字典中的要求。