计算哈希表中字符串出现次数

时间:2016-11-20 23:19:36

标签: c++ hashtable

我在C ++中编写自己的HashTable类,需要向用户输出表中每个字符串的出现次数。例如,如果这是输入:testing, 1, 2, testing,这是哈希表(使用链接和节点指针完成):

[0]->testing, testing
[1]->2
[2]->1

这将是用户的输出(计数,后跟单词):

2 testing
1 2
1 1

我遇到的问题是如何跟踪哈希表中每个单词的数量,或者如何找到它。我从this question开始,但无法在我的代码中实现另一个数组。

我也尝试了this question中的解决方案,但由于我使用了指针/链式散列,它没有用。

我的问题是,我是否需要使用单独的字符串数组来跟踪已经使用过的字符串,或者是否有一种简单的方法来递归遍历哈希表的每个索引并打印出来每个字符串的出现次数?我想我需要在我的insert函数或我的printData函数中完成此操作。

供参考,这是我的代码:

HashTable.h

#include <string>
#include <iostream>

using namespace std;

struct Entry {
    string word;
    Entry* next;
};

class HashTable {
public:
    HashTable();
    HashTable(int);
    int hash(string);
    void insert(string);
    void printData();
    int getCapacity() const;
private:
    //Member variables
    int CAPACITY; // The initial capacity of the HashTable
    Entry **data; // The array to store the data of strings (Entries)
};

HashTable.cpp

#include "HashTable.h"

HashTable::HashTable()
{
    CAPACITY = 0;
    data = new Entry*[0]; 
}

HashTable::HashTable(int _cap)
{
    CAPACITY = _cap;
    data = new Entry*[_cap];

    for (int i = 0; i < CAPACITY; i++) {
        data[i] = new Entry;
        data[i]->word = "empty";
        data[i]->next = nullptr;
    }
}

int HashTable::hash(string key)
{
    int hash = 0;

    for (unsigned int i = 0; i < key.length(); i++) {
        hash = hash + (int)key[i];
    }

    return hash % CAPACITY;
}

void HashTable::insert(string entry)
{
    int index = hash(entry);

    if (data[index]->word == "empty") {
        data[index]->word = entry;
    } else {
        Entry* temp = data[index];
        Entry* e = new Entry;
        e->word = entry;
        e->next = nullptr;

        while (temp->next != nullptr) {
            temp = temp->next;
        }

        temp->next = e;
    }
}   

void HashTable::printData()
{
    for (int i = 0; i < CAPACITY; i++) {
        if (data[i]->next != nullptr) {
            while(data[i]->next != nullptr) {
                cout << data[i]->word << " -> ";
                data[i] = data[i]->next;
            }

            cout << data[i]->word << endl;
        } else {
            cout << data[i]->word << endl;
        }
    }
}

int HashTable::getCapacity() const
{
    return CAPACITY;
}

注意:我不能使用标准C ++库中的任何函数/数据结构。

1 个答案:

答案 0 :(得分:2)

我这里只看到两个选项

  1. 遍历整个链表以计算出现次数。使用地图&lt; string,int&gt;计算每个字符串的出现次数。

  2. 您应该对链表进行排序。因此,当您插入新节点时,您将把它插入到确切的位置。您可以使用strcmp进行比较。这样,您可以在一个遍历中精确计算每个单词并仅使用一个整数变量,但您的插入时间和复杂性将会增加。