如何计算成功和失败的平均探针长度 - 线性探针(哈希表)

时间:2010-04-01 22:31:24

标签: java hashtable linear probe

我正在为我的Data Structures类做作业。我们被要求研究负载因子为.1,.2,.3,....和.9的线性探测。测试的公式是:

使用线性探测的平均探针长度大致为

成功 - > (1 + 1 /(1-L)** 2)/ 2

失败 - > (1 + 1(1-L))/ 2。

我们需要使用上面的公式找到理论(只是在公式中插入加载因子),然后我们必须计算经验(我不太确定该怎么做)。这是其余的要求

  

**对于每个负载因子,10,000个随机生成的正整数   介于1和50000之间(含)   被插入一张桌子   “正确”的大小,“正确”的地方   严格基于负载系数   你正在测试。允许重复。   请确保您的公式是随机的   生成的int是正确的。有一个   java.util中名为Random的类。使用   它!在一张右表(基于   在L)尺寸加载10,000   整理,新搜索100次   从该范围生成随机整数   1到50000.计算平均值   每个探针长度   公式并指出分母   例如,每个计算中使用的每个测试对于.5负载的每个测试将具有>的表。 >尺寸   大约20,000(调整为   素数)和类似的每个测试   .9负载会有一个表   大约10,000 / .9(再次   调整为素数)。

     

程序应该运行显示   各种负载因素测试,   每次搜索的平均探测(两个   用来计算的分母   平均值将增加到100),而且   使用公式的理论答案   以上。 **

如何计算经验成功?

到目前为止,这是我的代码:

import java.util.Random;
/**
 *
 * @author Johnny
 */
class DataItem
{
    private int iData;
    public DataItem(int it)
    {iData = it;}
    public int getKey()
    {
        return iData;
    }
}

class HashTable
{
private DataItem[] hashArray;
private int arraySize;
public HashTable(int size)
{
    arraySize = size;
    hashArray = new DataItem[arraySize];
}
public void displayTable()
{
    int sp=0;
    System.out.print("Table: ");
    for(int j=0; j<arraySize; j++)
{
    if(sp>50){System.out.println("");sp=0;}

    if(hashArray[j] != null){
        System.out.print(hashArray[j].getKey() + " ");sp++;}
    else
    {System.out.print("** "); sp++;}
}
    System.out.println("");
}

public int hashFunc(int key)
{
    return key %arraySize;
}

public void insert(DataItem item)
{
    int key = item.getKey();
    int hashVal = hashFunc(key);

    while(hashArray[hashVal] != null &&
                    hashArray[hashVal].getKey() != -1)
    {
        ++hashVal;
        hashVal %= arraySize;
    }
    hashArray[hashVal]=item;
}
public int hashFunc1(int key)
{
    return key % arraySize;
}

public int hashFunc2(int key)
{
// non-zero, less than array size, different from hF1
// array size must be relatively prime to 5, 4, 3, and 2
    return 5 - key % 5;
}


public DataItem find(int key) // find item with key
// (assumes table not full)
    {
    int hashVal = hashFunc1(key); // hash the key
    int stepSize = hashFunc2(key); // get step size
    while(hashArray[hashVal] != null) // until empty cell,
    { // is correct hashVal?
        if(hashArray[hashVal].getKey() == key)
            return hashArray[hashVal]; // yes, return item
        hashVal += stepSize; // add the step
        hashVal %= arraySize; // for wraparound
    }
    return null; // can’t find item
    }
}
public class n00645805 {
/**
 * @param args the command line arguments
 */
public static void main(String[] args) {
    double b=1;
    double L;
    double[] tf = new double[9];
    double[] ts = new double[9];
    double d=0.1;
    DataItem aDataItem;
    int aKey;
    HashTable h1Table = new HashTable(100003); //L=.1
    HashTable h2Table = new HashTable(50051);  //L=.2
    HashTable h3Table = new HashTable(33343);  //L=.3
    HashTable h4Table = new HashTable(25013);  //L=.4
    HashTable h5Table = new HashTable(20011);  //L=.5
    HashTable h6Table = new HashTable(16673);  //L=.6
    HashTable h7Table = new HashTable(14243);  //L=.7
    HashTable h8Table = new HashTable(12503);  //L=.8
    HashTable h9Table = new HashTable(11113);  //L=.9

    fillht(h1Table);
    fillht(h2Table);
    fillht(h3Table);
    fillht(h4Table);
    fillht(h5Table);
    fillht(h6Table);
    fillht(h7Table);
    fillht(h8Table);
    fillht(h9Table);
    pm(h1Table);
    pm(h2Table);
    pm(h3Table);
    pm(h4Table);
    pm(h5Table);
    pm(h6Table);
    pm(h7Table);
    pm(h8Table);
    pm(h9Table);

    for (int j=1;j<10;j++)
    {
        //System.out.println(j);
        L=Math.round((b-d)*100.0)/100.0;
        System.out.println(L);
        System.out.println("ts "+(1+(1/(1-L)))/2);
        System.out.println("tf "+(1+(1/((1-L)*(1-L))))/2);
        tf[j-1]=(1+(1/(1-L)))/2;
        ts[j-1]=(1+(1/((1-L)*(1-L))))/2;
        d=d+.1;
    }
    display(ts,tf);
}
public static void fillht(HashTable a)
{
    Random r = new Random();
    for(int j=0; j<10000; j++)
    {
        int aKey;
        DataItem y;
        aKey =1+Math.round(r.nextInt(50000));
        y = new DataItem(aKey);
        a.insert(y);

    }
}
public static void pm(HashTable a)
{
    DataItem X;
    int numsuc=0;
    int numfail=0;
    int aKey;
    Random r = new Random();
    for(int j=0; j<100;j++)
    {
        aKey =1+Math.round(r.nextInt(50000));
        X = a.find(aKey);
        if(X != null)
        {
            //System.out.println("Found " + aKey);
            numsuc++;
        }
        else
        {
            //System.out.println("Could not find " + aKey);
            numfail++;
        }

    }
    System.out.println("# of succ is "+ numsuc+" # of failures is "+ numfail);
}
public static void display(double[] s, double[] f)
{

}

}

1 个答案:

答案 0 :(得分:3)

您应该考虑到Java的HashTable使用封闭寻址(无探测)实现,因此您可以使用单独的存储区来放置许多项目。这不是您在基准测试中寻找的内容。我不确定HashMap实现,但我认为它也使用开放寻址。

所以忘记JDK类..因为你想要计算经验值,你应该编写自己的哈希表版本,使用开放式寻址实现线性探测但是每当你试图从hashmap中获取一个值时,你应该注意计算探测长度。

例如,您可以编写hashmap,然后处理

class YourHashMap
{
   int empiricalGet(K key)
   {
     // search for the key but store the probe length of this get operation

     return probeLength;
   }
}

然后,您可以通过搜索所需的键数并计算平均探测长度来轻松对其进行基准测试。

否则,您可以为hasmap提供存储总探测长度和请求获取次数的能力,并在基准运行后检索它们以计算平均值。

这种练习必须证明经验价值与理论价值一致。因此,还要考虑到这样一个事实,即您可能需要许多基准测试,然后对它们进行平均测试,确保方差不会太高。