查找大子串的错误计数时出错

时间:2019-06-06 05:57:55

标签: java

我正在尝试检查和计算输入字符串的每个子字符串的字谜对。

例如,如果输入字符串为mom,则字谜对为m,mmo,om

该代码运行良好,并通过了三个字符串测试用例。但是由于长输入字符串(如:

)的超时限制,代码被终止了
ifailuhkqqhucpoltgtyovarjsnrbfpvmupwjjjfiwwhrlkpekxxnebfrwibylcvkfealgonjkzwlyfhhkefuvgndgdnbelgruel

我对此问题进行了尝试和研究,但此错误令我震惊。你们可以请我帮忙解决您的建议吗?

提供以下代码:

import java.io.*;
import java.math.*;
import java.security.*;
import java.text.*;
import java.util.*;
import java.util.concurrent.*;
import java.util.regex.*;

public class Solution {

    // Complete the sherlockAndAnagrams function below.
    static int sherlockAndAnagrams(String s) {

        for(int i=0; i<s.length(); i++){
            for(int j=i+1; j<=s.length(); j++){
                sArray[index] = s.substring(i,j);
                index++;
                //System.out.println(s.substring(i,j));
                //System.out.println(Arrays.toString(sArray));
            }
        }
        for(int i=0; i<sArray.length; i++){
            for(int j=i; j< sArray.length; j++){
                if(i != j){
                if(null == sArray[i])
                break;
                if(null == sArray[j])
                break;
                char[] sArray1 = sArray[i].toCharArray();
                char[] sArray2 = sArray[j].toCharArray();
                //System.out.println(sArray1);
                //System.out.println(sArray2);
                //int index_str = 0;
                Hashtable<Character, Integer>sHash1 = new Hashtable<Character, Integer>();
                Hashtable<Character, Integer>sHash2 = new Hashtable<Character, Integer>();
                for (int k = 0; k < sArray1.length; k++) { 

                    if (sHash1.get(sArray1[k]) == null) { 

                        sHash1.put(sArray1[k], 1); 
                    } 
                    else { 
                        Integer c = (int)sHash1.get(sArray1[k]); 
                        sHash1.put(sArray1[k], ++c); 
                    } 
                } 

                // Mapping second String 
                for (int l = 0; l < sArray2.length; l++) { 

                    if (sHash2.get(sArray2[l]) == null) 
                        sHash2.put(sArray2[l], 1); 
                    else { 

                        Integer d = (int)sHash2.get(sArray2[l]); 
                        sHash2.put(sArray2[l], ++d); 
                    } 
                } 

                if(sHash1.equals(sHash2)){
                    count++;
                }
                }
            }
        }

        }*/
        //System.out.println(sHash);
        return count;
    }

    private static final Scanner scanner = new Scanner(System.in);

    public static void main(String[] args) throws IOException {
        BufferedWriter bufferedWriter  = new BufferedWriter(new FileWriter(System.getenv("OUTPUT_PATH")));

        int q = scanner.nextInt();
        scanner.skip("(\r\n|[\n\r\u2028\u2029\u0085])?");

        for (int qItr = 0; qItr < q; qItr++) {
            String s = scanner.nextLine();

            int result = sherlockAndAnagrams(s);

            bufferedWriter.write(String.valueOf(result));
            bufferedWriter.newLine();
        }

        bufferedWriter.close();

        scanner.close();
    }
}

1 个答案:

答案 0 :(得分:0)

这是您问题的一部分:

    for(int i=0; i<s.length(); i++){
        for(int j=i+1; j<=s.length(); j++){
            sArray[index] = s.substring(i,j);
            index++;
        }
    }

substring方法返回一个新的字符串对象。您正在为每个可能的子字符串分配内存。

您创建的新字符串对象的数量可以使用以下公式大致计算:n *(n + 1)/ 2。那东西增长很快。例如,n = 10时为55,n = 50时已为1275。

所以对于长字符串,您的代码可能已经崩溃,因为这里的内存不足。

这是您问题的第二部分:

    for(int i=0; i<sArray.length; i++){
        for(int j=i; j< sArray.length; j++){

您将每个子字符串与每个子字符串进行比较。可以再次使用n *(n + 1)/ 2计算迭代次数。当您的长度为50的字符串超过1000个子字符串时,则迭代超过500000。

此外:在每次迭代中,您将创建两个char数组和两个哈希表。至少在每个循环之后都将它们丢弃,因此内存不应该成为问题。但是速度可能。

我认为这就是为什么长字符串超时的原因。

以下是有关此问题的不完整提示:

  • 在第一个大循环中,只需保存索引(i和j)以备将来使用,而不是为每个子字符串分配一个完整的新字符串。
  • 在第二个大循环中,您正在重复重做子字符串的计算。例如,您要比较子字符串0至1,2,3,...,然后要比较子字符串1至2,3,...,因此子字符串2已被计算两次。最后一个子字符串将对其之前的每个子字符串重复计算。您可以尝试保存结果以防止重新计算。但这会再次消耗记忆。总是要在内存和计算周期之间进行权衡。
  • 也许您可以不使用char数组。您可以像数组一样遍历字符串。
  • 也许您可以不使用哈希表。只需直接比较字符即可。

我无法编译您的代码,因此无法验证我的假设。 }太多,sArray似乎没有声明。我懒得尝试解决这个问题。

链接: