通过不同的字符串键比较Hashmaps

时间:2017-02-15 18:50:57

标签: java hashmap information-retrieval

我有两个HashMaps并希望尽可能快地比较它,但问题是,mapA的字符串由两个连接空格的单词组成。 mapB的字符串只有一个字。

我不想计算出现的情况,已经完成,我想比较两个不同的字符串

mapA: 
key: hello world, value: 10 
key: earth hi, value: 20

mapB:  
key: hello, value: 5  
key: world, value: 15
key: earth, value: 25
key: hi,    value: 35

mapA的第一个键应该找到键"你好"和关键"世界"来自mapB

我想要做的是解析一个长文本以找到Co出现并设置一个值,它们出现的频率与所有单词有关。

我的第一次尝试:

for(String entry : mapA.keySet())
    {
String key = (String) entry;
      Integer mapAvalue = (Integer) mapA.get(entry);
      Integer tokenVal1=0, tokenVal2=0;
      String  token1=key.substring(0, key.indexOf(" "));
      String      token2=key.substring(key.indexOf(" "),key.length()).trim();
         for( String mapBentry : mapb.keySet())
        {
            String tokenkey = mapBentry;
            if(tokenkey.equals(token1)){
                tokenVal1=(Integer)tokens.get(tokenentry);
            }
            if(tokenkey.equals(token2)){
                tokenVal2=(Integer)tokens.get(tokenentry);
            }
            if(token1!=null && token2!=null && tokenVal1>1000 && tokenVal2>1000 ){

                **procedurecall(mapAvalue, token1, token2, tokenVal1, tokenVal2);**


             }
        }


    }

1 个答案:

答案 0 :(得分:0)

如果您只是想找到一个特定的密钥,那么您不应该迭代HashMap(O(n)),这就是HashMap查找(O(1))用于。所以消除你的内循环。

您还可以在代码中删除一些不必要的变量(例如keytokenkey)。您也不需要第三个tokens地图,您可以将令牌值放在mapb中。

for(String entry : mapA.keySet())
{
  Integer mapAvalue = (Integer) mapA.get(entry);
  String  token1=entry.substring(0, entry.indexOf(" "));
  String  token2=entry.substring(entry.indexOf(" "),entry.length()).trim();

  if(mapb.containsKey(token1) && mapb.containskey(token2))
  {
       // look up the tokens:
       Integer tokenVal1=(Integer)mapb.get(token1);
       Integer tokenVal2=(Integer)mapb.get(token2);

       if(tokenVal1>1000 && tokenVal2>1000)
       {
            **procedurecall(mapAvalue, token1, token2, tokenVal1, tokenVal2);**
       }
  }