大家好!我这里有一个程序,使用合并排序从文件中排序50,000个单词。我在他的算法导论中遵循了Thomas Cormen的伪代码,当我手动“手动”时,它似乎正确。但是,当我运行该程序时,它会显示 Exception in thread "main" java.lang.ArrayIndexOutOfBoundsException: 2
。是的,我认为这是由于大 NO_OF_WORDS
(即50,000),但即使我将其减少到10,仍然会显示相同的错误。
import java.io.*;
import java.util.*;
public class SortingAnalysis {
public static void merge(String[] A, int p, int q, int r) {
int n1 = q-p+1;
int n2 = r-q;
String[] L = new String[n1+1];
String[] R = new String[n2+1];
for (int i=1; i<n1; i++) {
L[i] = A[p+i-1];
}
for (int j=1; j<n2; j++) {
R[j] = A[q+j];
}
L[n1+1] = "zzzzz"; //for infinity because if I use Math.floor, it will return a double
R[n2+1] = "zzzzz";
int i=1;
int j=1;
for (int k=p; k<=r; k++) {
int comparison = L[i].compareTo(R[j]);
if (comparison <= 0){
A[k] = L[i];
i++;
}
else {
A[k] = R[j];
j++;
}
}
}
public static void mergeSort (String[] A, int p, int r) {
if (p<r) {
int q = (p+r)/2;
mergeSort(A, p, q);
mergeSort(A, q+1, r);
merge(A, p, q, r);
}
}
public static void main(String[] args) {
final int NO_OF_WORDS = 50000;
try {
Scanner file = new Scanner(new File(args[0]));
String[] words = new String[NO_OF_WORDS];
int i = 0;
while(file.hasNext() && i < NO_OF_WORDS) {
words[i] = file.next();
i++;
}
long start = System.currentTimeMillis();
mergeSort(words, 0, words.length-1);
long end = System.currentTimeMillis();
System.out.println("Sorted Words: ");
for(int j = 0; j < words.length; j++) {
System.out.println(words[j]);
}
System.out.print("Running time: " + (end - start) + "ms");
}
catch(SecurityException securityException) {
System.err.println("Error");
System.exit(1);
}
catch(FileNotFoundException fileNotFoundException) {
System.err.println("Error");
System.exit(1);
}
}
}
我认为这是因为String [] L和R的声明。或者不是。请帮我解决问题所在。非常感谢你!
修改
Cormen的伪代码
MERGE(A, p, q, r )
n1 ← q − p + 1
n2 ←r − q
create arrays L[1 . . n1 + 1] and R[1 . . n2 + 1]
for i ← 1 to n1
do L[i ] ← A[p + i − 1]
for j ← 1 to n2
do R[ j ] ← A[q + j ]
L[n1 + 1]←∞
R[n2 + 1]←∞
i ← 1
j ← 1
for k ← p to r
do if L[i ] ≤ R[ j ]
then A[k] ← L[i ]
i ←i + 1
else A[k] ← R[ j ]
j ← j + 1
答案 0 :(得分:1)
您的merge()
方法存在一个大问题:
String[] L = new String[n1+1];
String[] R = new String[n2+1];
不能很好地发挥
L[n1+1] = "zzzzz"; //for infinity because if I use Math.floor, it will return a double
R[n2+1] = "zzzzz";
无论ArrayIndexOutOfBoundsException
和n1
的值如何,您都会在此处获得n2
,因为数组在Java中基于0。
答案 1 :(得分:1)
我不知道你的伪代码是什么,但你的实现似乎错了。我看一下wikipedia合并排序,它完全不同。
所以我不会在这里给你完整的工作算法。我只是给你解决方案来解决你的indexOutOfBounds问题,但你仍然需要在你的实现上做更多的工作。
在Java中执行此操作:
String[] L = new String[5];
声明一个字符串数组,其中包含5
个字符串。
以这种方式访问这些字符串:L[anIndex]
。
第一个元素位于索引0
。
因此,如果您有一个大小为5
的数组,则最后一个元素位于索引4
(因为我们从0开始)。
在您的代码中执行此操作:
String[] L = new String[n1+1];
String[] R = new String[n2+1];
然后:
L[n1+1] = "zzzzz";
R[n2+1] = "zzzzz";
因此,您总是尝试在不存在的索引处访问字符串。
每个数组中的最后一个元素分别是n1
和n2
(因为数组大小为n1+1
和n2+1
)。
我希望你能更好地理解数组在Java中的工作方式。现在你必须改进你的实现,因为它仍然无法正常工作。如果你不理解它,也许给我们你使用的伪代码。
编辑:
好的,我做了一些修正。
这是工作算法。我不得不改变几个索引来适应Java“基于0的数组”,看看:
import java.io.*;
import java.util.*;
public class SortingAnalysis {
public static void merge(String[] A, int p, int q, int r) {
int n1 = q-p+1;
int n2 = r-q;
if(A[p]==null || A[q]==null)return;
String[] L = new String[n1+1];
String[] R = new String[n2+1];
for (int i=0; i<n1; i++) {
L[i] = A[p+i];
}
for (int j=0; j<n2; j++) {
R[j] = A[q+j +1];
}
L[n1] = "zzzzz"; //for infinity because if I use Math.floor, it will return a double
R[n2] = "zzzzz";
int i=0;
int j=0;
for (int k=p; k<=r; k++) {
int comparison = L[i].compareTo(R[j]);
if (comparison <= 0){
A[k] = L[i];
i++;
}
else {
A[k] = R[j];
j++;
}
}
}
public static void mergeSort (String[] A, int p, int r) {
if (p<r) {
int q = (p+r)/2;
mergeSort(A, p, q);
mergeSort(A, q+1, r);
merge(A, p, q, r);
}
}
public static void main(String[] args) {
final int NO_OF_WORDS = 50000;
try {
Scanner file = new Scanner("bla blya blay byla ybla");
ArrayList<String> words = new ArrayList<String>();
while(file.hasNext() && words.size() < NO_OF_WORDS) {
words.add(file.next());
}
String [] wordsArray = new String[words.size()];
words.toArray(wordsArray);
long start = System.currentTimeMillis();
mergeSort(wordsArray, 0, wordsArray.length-1);
long end = System.currentTimeMillis();
System.out.println("Sorted Words: ");
for(int j = 0; j < wordsArray.length; j++) {
System.out.println(wordsArray[j]);
}
System.out.print("Running time: " + (end - start) + "ms");
}
catch(SecurityException securityException) {
System.err.println("Error");
System.exit(1);
}
}
}
请注意,我已经更改了Main,现在我使用arrayList来避免空值,如果你的文本包含的字数少于原始数组的大小。使用您的解决方案,如果您没有填充50000个单词,则在数组中得到null,然后在合并算法中为nullPointerException。