合并排序。错误 - 线程“main”中的异常java.lang.ArrayIndexOutOfBoundsException:2

时间:2012-07-10 13:49:08

标签: java mergesort arrays

大家好!我这里有一个程序,使用合并排序从文件中排序50,000个单词。我在他的算法导论中遵循了Thomas Cormen的伪代码,当我手动“手动”时,它似乎正确。但是,当我运行该程序时,它会显示 Exception in thread "main" java.lang.ArrayIndexOutOfBoundsException: 2 。是的,我认为这是由于大 NO_OF_WORDS (即50,000),但即使我将其减少到10,仍然会显示相同的错误。

import java.io.*;
import java.util.*;

public class SortingAnalysis {

    public static void merge(String[] A, int p, int q, int r) {
        int n1 = q-p+1;
        int n2 = r-q;
        String[] L = new String[n1+1];
        String[] R = new String[n2+1];
        for (int i=1; i<n1; i++) {
            L[i] = A[p+i-1];
        }
        for (int j=1; j<n2; j++) {
            R[j] = A[q+j];
        }
        L[n1+1] = "zzzzz"; //for infinity because if I use Math.floor, it will return a double
        R[n2+1] = "zzzzz";
        int i=1;
        int j=1;
        for (int k=p; k<=r; k++) {
            int comparison = L[i].compareTo(R[j]);
            if (comparison <= 0){
                A[k] = L[i];
                i++;
            }
            else {
                A[k] = R[j];
                j++;
            }

        }

    }

    public static void mergeSort (String[] A, int p, int r) {
        if (p<r) {
            int q = (p+r)/2;
            mergeSort(A, p, q);
            mergeSort(A, q+1, r);
            merge(A, p, q, r);
        }
    }

    public static void main(String[] args) {
        final int NO_OF_WORDS = 50000;
        try {
            Scanner file = new Scanner(new File(args[0]));
            String[] words = new String[NO_OF_WORDS];

            int i = 0;
            while(file.hasNext() && i < NO_OF_WORDS) {
                words[i] = file.next();
                i++;
            }
            long start = System.currentTimeMillis();

            mergeSort(words, 0, words.length-1);

            long end = System.currentTimeMillis();
            System.out.println("Sorted Words: ");
            for(int j = 0; j < words.length; j++) {
                System.out.println(words[j]);
            }   
            System.out.print("Running time: " + (end - start) + "ms");

        }
        catch(SecurityException securityException) {
            System.err.println("Error");
            System.exit(1);
        }
        catch(FileNotFoundException fileNotFoundException) {
            System.err.println("Error");
            System.exit(1);
        } 
    } 
}

我认为这是因为String [] L和R的声明。或者不是。请帮我解决问题所在。非常感谢你!

修改
Cormen的伪代码

MERGE(A, p, q, r )
n1 ← q − p + 1
n2 ←r − q
create arrays L[1 . . n1 + 1] and R[1 . . n2 + 1]
for i ← 1 to n1
     do L[i ] ← A[p + i − 1]
for j ← 1 to n2
     do R[ j ] ← A[q + j ]
L[n1 + 1]←∞
R[n2 + 1]←∞
i ← 1
j ← 1
for k ← p to r
     do if L[i ] ≤ R[ j ]
        then A[k] ← L[i ]
             i ←i + 1
        else A[k] ← R[ j ]
             j ← j + 1

2 个答案:

答案 0 :(得分:1)

您的merge()方法存在一个大问题:

String[] L = new String[n1+1];
String[] R = new String[n2+1];

不能很好地发挥

L[n1+1] = "zzzzz"; //for infinity because if I use Math.floor, it will return a double
R[n2+1] = "zzzzz";

无论ArrayIndexOutOfBoundsExceptionn1的值如何,您都会在此处获得n2,因为数组在Java中基于0。

答案 1 :(得分:1)

我不知道你的伪代码是什么,但你的实现似乎错了。我看一下wikipedia合并排序,它完全不同。

所以我不会在这里给你完整的工作算法。我只是给你解决方案来解决你的indexOutOfBounds问题,但你仍然需要在你的实现上做更多的工作。

在Java中执行此操作:

String[] L = new String[5];

声明一个字符串数组,其中包含5个字符串。

以这种方式访问​​这些字符串:L[anIndex]

第一个元素位于索引0

因此,如果您有一个大小为5 的数组,则最后一个元素位于索引4 (因为我们从0开始)。

在您的代码中执行此操作:

String[] L = new String[n1+1];
String[] R = new String[n2+1];

然后:

L[n1+1] = "zzzzz";
R[n2+1] = "zzzzz";

因此,您总是尝试在不存在的索引处访问字符串。 每个数组中的最后一个元素分别是n1n2(因为数组大小为n1+1n2+1)。

我希望你能更好地理解数组在Java中的工作方式。现在你必须改进你的实现,因为它仍然无法正常工作。如果你不理解它,也许给我们你使用的伪代码。

编辑:

好的,我做了一些修正。

这是工作算法。我不得不改变几个索引来适应Java“基于0的数组”,看看:

import java.io.*;
import java.util.*;

public class SortingAnalysis {

    public static void merge(String[] A, int p, int q, int r) {
        int n1 = q-p+1;
        int n2 = r-q;
        if(A[p]==null || A[q]==null)return;
        String[] L = new String[n1+1];
        String[] R = new String[n2+1];
        for (int i=0; i<n1; i++) {
            L[i] = A[p+i];
        }
        for (int j=0; j<n2; j++) {
            R[j] = A[q+j +1];
        }
        L[n1] = "zzzzz"; //for infinity because if I use Math.floor, it will return a double
        R[n2] = "zzzzz";
        int i=0;
        int j=0;
        for (int k=p; k<=r; k++) {
            int comparison = L[i].compareTo(R[j]);
            if (comparison <= 0){
                A[k] = L[i];
                i++;
            }
            else {
                A[k] = R[j];
                j++;
            }

        }

    }

    public static void mergeSort (String[] A, int p, int r) {
        if (p<r) {
            int q = (p+r)/2;
            mergeSort(A, p, q);
            mergeSort(A, q+1, r);
            merge(A, p, q, r);
        }
    }

    public static void main(String[] args) {
        final int NO_OF_WORDS = 50000;
        try {
            Scanner file = new Scanner("bla blya blay byla ybla");
            ArrayList<String> words = new ArrayList<String>();

            while(file.hasNext() && words.size() < NO_OF_WORDS) {
                words.add(file.next());
            }
            String [] wordsArray = new String[words.size()];
            words.toArray(wordsArray);
            long start = System.currentTimeMillis();

            mergeSort(wordsArray, 0, wordsArray.length-1);

            long end = System.currentTimeMillis();
            System.out.println("Sorted Words: ");
            for(int j = 0; j < wordsArray.length; j++) {
                System.out.println(wordsArray[j]);
            }   
            System.out.print("Running time: " + (end - start) + "ms");

        }
        catch(SecurityException securityException) {
            System.err.println("Error");
            System.exit(1);
        }

    }
}

请注意,我已经更改了Main,现在我使用arrayList来避免空值,如果你的文本包含的字数少于原始数组的大小。使用您的解决方案,如果您没有填充50000个单词,则在数组中得到null,然后在合并算法中为nullPointerException。