Question

我正在经历一个排列/字谜问题，并希望输入最有效的检查方法。现在，我正在Java土地上这样做，因此有一个包括排序在内的一切图书馆。检查两个字符串是否是彼此的字谜的第一种方法是检查长度，以某种方式对它们进行排序，然后比较所述字符串的每个索引。代码如下：

private boolean validAnagram(String str, String pair) {
if(str.length() != pair.length()){
    return false;
}

char[] strArr = str.toCharArray();
char[] pairArr = pair.toCharArray();


Arrays.sort(strArr);
str = new String(strArr);

Arrays.sort(pairArr);
pair = new String(pairArr);

for(int i = 0; i<str.length(); i++){
    if(str.charAt(i) != pair.charAt(i)){
        return false;
    }
}
return true;
}

或者，我认为根据ascii值检查更容易，并避免检查每个可能的字符。代码如下：

private boolean validAnagram(String str, String pair) {
if(str.length() != pair.length()){
    return false;
}

char[] strArr = str.toCharArray();
char[] pairArr = pair.toCharArray();



int strValue = 0;
int pairValue = 0;

for(int i =0; i < strArr.length; i++){
    strValue+= (int) strArr[i];
    pairValue+= (int) pairArr[i];
}

if(strValue != pairValue){
    return false;
}
return true;
}

那么，这是一个更好的解决方案？我不太了解Arrays给我的那种，但是当我环顾旧的互联网时，这是更常见的答案。让我想知道我是否遗漏了什么。

Answer 1

这是一个非常简单的实现。

public boolean isAnagram(String strA, String strB) {
  // Cleaning the strings (remove white spaces and convert to lowercase)
  strA = strA.replaceAll("\\s+","").toLowerCase();
  strB = strB.replaceAll("\\s+","").toLowerCase();

  // Check every char of strA and removes first occurence of it in strB
  for (int i = 0; i < strA.length(); i++ ) {
    if (strB.equals("")) return false;  // strB is already empty : not an anagram
    strB = strB.replaceFirst(Pattern.quote("" + strA.charAt(i)), "");
  }

  // if strB is empty we have an anagram
  return strB.equals("");
}

最后：

System.out.println(isAnagram("William Shakespeare", "I am a weakish speller")); // true

Answer 2

最佳解决方案取决于您的目标，代码大小，内存占用或最少的计算。

一个非常酷的解决方案，尽可能减少代码，不是Java 8中最快的O（nlog n）和非常低效的内存：

public class Anagram {
  public static void main(String[] argc) {
    String str1 = "gody";
    String str2 = "dogy";

    boolean isAnagram =
    str1.chars().mapToObj(c -> (char) c).sorted().collect(Collectors.toList())
    .equals(str2.chars().mapToObj(c -> (char) c).sorted().collect(Collectors.toList()));

    System.out.println(isAnagram);
  }
}

Answer 3

我尝试了一些使用Sets的解决方案，并使每个运行1000万次以使用您的示例数组进行测试：

private static String[] input = {"tea", "ate", "eat", "apple", "java", "vaja", "cut", "utc"};

首先，我习惯称之为algotirhms的方法：

public static void main(String[] args) {
    long startTime = System.currentTimeMillis();
    for (int x = 0; x < 10000000; x++) {
        Set<String> confirmedAnagrams = new HashSet<>();
        for (int i = 0; i < (input.length / 2) + 1; i++) {
            if (!confirmedAnagrams.contains(input[i])) {
                for (int j = i + 1; j < input.length; j++) {
                        if (isAnagrams1(input[i], input[j])) {
                            confirmedAnagrams.add(input[i]);
                            confirmedAnagrams.add(input[j]);
                        }
                }
            }
        }
        output = confirmedAnagrams.toArray(new String[confirmedAnagrams.size()]);
    }
    long endTime = System.currentTimeMillis();
    System.out.println("Total time: " + (endTime - startTime));
    System.out.println("Average time: " + ((endTime - startTime) / 10000000D));
}

然后我使用了基于HashSet字符的算法。我将每个单词的每个字符添加到HashSet中，如果HashSet不是首字母的长度，则表示它们不是字谜。

我的算法及其运行时间：

算法1：

    private static boolean isAnagrams1(String x, String y) {
    if (x.length() != y.length()) {
        return false;
    } else if (x.equals(y)) {
        return true;
    }

    Set<Character> anagramSet = new HashSet<>();
    for (int i = 0; i < x.length(); i++) {
        anagramSet.add(x.charAt(i));
        anagramSet.add(y.charAt(i));
    }

    return anagramSet.size() != x.length();
}

这有运行时：

Total time: 6914
Average time: 6.914E-4

算法2

private static boolean isAnagrams2(String x, String y) {
    if (x.length() != y.length()) {
        return false;
    } else if (x.equals(y)) {
        return true;
    }

    Set<Character> anagramSet = new HashSet<>();
    char[] xAr = x.toCharArray();
    char[] yAr = y.toCharArray();
    for (int i = 0; i < xAr.length; i++) {
        anagramSet.add(xAr[i]);
        anagramSet.add(yAr[i]);
    }

    return anagramSet.size() != x.length();
}

运行时具有：

Total time: 8752
Average time: 8.752E-4

算法3

对于这个算法，我决定发送Set through，因此我只为每个周期创建一次，并在每次测试后清除它。

    private static boolean isAnagrams3(Set<Character> anagramSet, String x, String y) {
    if (x.length() != y.length()) {
        return false;
    } else if (x.equals(y)) {
        return true;
    }

    for (int i = 0; i < x.length(); i++) {
        anagramSet.add(x.charAt(i));
        anagramSet.add(y.charAt(i));
    }

    return anagramSet.size() != x.length();
}

运行时具有：

Total time: 8251
Average time: 8.251E-4

算法4

这个算法不是我的，它属于Pratik Upacharya也回答了这个问题，为了让我比较：

    private static boolean isAnagrams4(String stringOne, String stringTwo) {
    char[] first = stringOne.toLowerCase().toCharArray();
    char[] second = stringTwo.toLowerCase().toCharArray();
    // if length of strings is not same 
    if (first.length != second.length) {
        return false;
    }
    int[] counts = new int[26];
    for (int i = 0; i < first.length; i++) {
        counts[first[i] - 97]++;
        counts[second[i] - 97]--;
    }
    for (int i = 0; i < 26; i++) {
        if (counts[i] != 0) {
            return false;
        }
    }
    return true;
}

运行时具有：

Total time: 5707
Average time: 5.707E-4

当然，这些运行时在每次测试运行时都会有所不同，为了进行正确的测试，需要更大的示例集，并且可能需要更多迭代。

*编辑，因为我在初始方法中犯了一个错误，Pratik Upacharya's算法似乎确实是更快的算法

Answer 4

我的解决方案：时间复杂度= O（n）

public static boolean isAnagram(String str1, String str2) {
    if (str1.length() != str2.length()) {
        return false;
    }

    for (int i = 0; i < str1.length(); i++) {
        char ch = str1.charAt(i);

        if (str2.indexOf(ch) == -1) 
            return false;
        else
            str2 = str2.replaceFirst(String.valueOf(ch), " ");
    }

    return true;
}

测试用例：

@Test
public void testIsPernutationTrue() {
    assertTrue(Anagram.isAnagram("abc", "cba"));
    assertTrue(Anagram.isAnagram("geeksforgeeks", "forgeeksgeeks"));
    assertTrue(Anagram.isAnagram("anagram", "margana"));
}

@Test
public void testIsPernutationFalse() {
    assertFalse(Anagram.isAnagram("abc", "caa"));
    assertFalse(Anagram.isAnagram("anagramm", "marganaa"));
}

Answer 5

这是我能够编译的更简单易读的解决方案...

    static boolean isAnagram(String a, String b) {
    if (a.length() == b.length()){
        char[] arr1 = a.toLowerCase().toCharArray();
        char[] arr2 = b.toLowerCase().toCharArray();
        Arrays.sort(arr1);
        Arrays.sort(arr2);
        if (Arrays.equals(arr1, arr2)) return true;
        else return false;
    }else return false;
}

最好，贾斯汀

Answer 6

有几种方法可以检查两个字符串是否是字谜。你的问题是，哪一个是更好的解决方案。您的第一个解决方案有排序逻辑排序具有最坏的案例复杂度（nlogn）。你的第二个逻辑只使用一个具有复杂性的循环上）。

所以在这两个中，你的第二个解决方案只有O（n）复杂性将是比第一个更好的解决方案。

一种可能的解决方案：



private boolean checkAnagram(String stringOne , String stringTwo){
        char[] first = stringOne.toLowerCase().toCharArray(); 
        char[] second = stringTwo.toLowerCase().toCharArray();
        // if length of strings is not same 
        if (first.length != second.length)
            return false;
        int[] counts = new int[26]; 
        for (int i = 0; i < first.length; i++){
            counts[first[i]-97]++;  
            counts[second[i]-97]--;   
        }
        for (int i = 0; i<26; i++)
            if (counts[i] != 0)
                return false;
        return true;
    }

private boolean checkAnagram(String stringOne , String stringTwo){ char[] first = stringOne.toLowerCase().toCharArray(); char[] second = stringTwo.toLowerCase().toCharArray(); // if length of strings is not same if (first.length != second.length) return false; int[] counts = new int[26]; for (int i = 0; i < first.length; i++){ counts[first[i]-97]++; counts[second[i]-97]--; } for (int i = 0; i<26; i++) if (counts[i] != 0) return false; return true; }

Answer 7

//here best solution for an anagram
import java.util.*;

class Anagram{
public static void main(String arg[]){

Scanner sc =new Scanner(System.in);
String str1=sc.nextLine();
String str2=sc.nextLine();
int i,j;

boolean Flag=true;
i=str1.length();
j=str2.length();


if(i==j){
for(int m=0;m<i;m++){
    for(int n=0;n<i;n++){
        if(str1.charAt(m)==str2.charAt(n)){
           Flag=true;
           break;
          }
          else
          Flag=false;
    }
}
}
else{
Flag=false;
}

if(Flag)
System.out.println("String is Anagram");
else
System.out.println("String is not Anagram");
}
}

Answer 8

招聘人员最近要我解决这个问题。在研究这个问题时，我想出了一个解决两种类型的解决方案字谜问题。

问题1：确定文本正文中是否存在anagram。

问题2：确定文本正文中是否存在正式的字谜。在这种情况下，anagram必须与您的文本大小相同比较它。在前一种情况下，两个文本的大小不一样一个人只需要包含另一个。

我的方法如下：

设置阶段：首先创建一个anagram类。这只会将文本转换为Map 其中包含有关字符的键，值包含数字输入字符的出现次数。我认为这至多需要O（n）时间复杂度。因为这最多需要两张地图，最糟糕的情况是复杂性将是O（2n）。至少我对渐近符号的天真理解说。

处理阶段：您所需要做的就是通过两个地图中较小的一个循环在更大的地图中查找。如果它不存在或存在但是由于出现次数不同，它不能使测试成为一个字谜。

这是确定我们是否有anagram的循环：

    boolean looking = true;
        for (Anagram ele : smaller.values()) {
            Anagram you = larger.get(ele);
                if (you == null || you.getCount() != ele.getCount()) {
                    looking = false;
                    break;
                }
        }
        return looking;

请注意，我创建了一个ADT来包含正在处理的字符串。他们首先转换为地图。

以下是创建Anagram对象的代码片段：

    private void init(String teststring2) {
        StringBuilder sb = new StringBuilder(teststring2);
        for (int i = 0; i &lt sb.length(); i++) {
            Anagram a = new AnagramImpl(sb.charAt(i));
            Anagram tmp = map.putIfAbsent(a, a);
            if (tmp != null) {
                tmp.updateCount();
            }
        }
    }

Answer 9

我想出了一个需要O（n）时间的解决方案，而且我什至不使用任何26个char数组... 检查一下：

StringBuffer a = new StringBuffer();
        a.append(sc.next().toLowerCase());

        StringBuffer b = new StringBuffer();
        b.append(sc.next().toLowerCase());
        if(a.length() !=b.length())
        {
            System.out.println("NO");
            continue;
        }
        int o =0;
        for(int i =0;i<a.length();i++)
        {
            if(a.indexOf(String.valueOf(b.charAt(i)))<0)
            {
               System.out.println("NO");
               o=1;break; 

            }
        }
        if(o==0)
         System.out.println("Yes");

Answer 10

考虑使用 HashMap 和 Arrays.sort

    private static Map<String, String> getAnagrams(String[] data) {

    Map<String, String> anagrams = new HashMap<>();
    Map<String, String> results = new HashMap<>();

    for (int i = 0; i < data.length; i++) {

        char[] chars = data[i].toLowerCase().toCharArray();
        Arrays.sort(chars);

        String sorted = String.copyValueOf(chars);

        String item = anagrams.get(sorted);
        if (item != null) {
            anagrams.put(sorted, item + ", " + i);
            results.put(sorted, anagrams.get(sorted));
        } else {
            anagrams.put(sorted, String.valueOf(i));
        }
    }

    return results;
}

我喜欢它，因为您只遍历数组一次。

Answer 11

使用原始数据类型的解决方案。

boolean isAnagram(char input1[], char input2[]) {
    int bitFlip = 32;

    if(input2.length != input1.length){return false;}

    boolean found = false;
    for (int x = 0; x < input1.length; x++) {
        found = false;
        for (int y = 0; y < input2.length; y++) {
             if (!found && ((input1[x] | bitFlip)) ==
             ( (input2[y] | bitFlip))) {
                found = true;
                input2[y] = 0;
            }
        }
        if (!found) {
            break;
        }
    }
    return found ;
}

这种方法不依赖任何排序工具。它的作用是通过迭代查找值，找到后将其设置为零，以避免输入带有重复字符（如“ pool”和“ loop”）的重复字符，该字符具有2个字母“ o”。

它也忽略了不翻转位而不依赖toLowerCase（）的情况，因为如果第6位（十进制为32）为1，则它为小写字母和大写字母，如果为零。

它是直接字节操作，因此它的性能会更好，就像图像操作中使用的一样。不利的一面可能是O（n ^ 2）。

这是在hackerrank中测试过的解决方案

anagram检查的最佳解决方案？

11 个答案: