如何存储英文字典?

时间:2013-03-30 15:18:24

标签: c++ arrays dictionary vector

我正在编写一个C ++程序,它读入英文字典(asc。order),而不是进一步处理。

在第一步中,我决定将所有内容读取到2D阵列。

string dictionary[x][y];

其中x的大小仅为26,代表A-Z,y是保存相对于x变量的单词。

但是我无法预测y的大小并且它是可变的,所以我不知道如何做到这一点。

其次,我听说过一个名为vector的容器。如何使用vector进行上述设计?例如,使用2D矢量,并使用第一个维度携带第一个字母,第二个维度携带单词?

6 个答案:

答案 0 :(得分:2)

您可以将multimapcharstring一起使用。

示例:

#include <iostream>
#include <map>
#include <fstream>
#include <string>

using namespace std;

multimap<char,string> dictionary;

void printLetter(char ch)
{
    for (auto it=dictionary.equal_range(ch).first; it!=dictionary.equal_range(ch).second; ++it)
    {
        cout << it->second << endl;
    }
}

int main()
{
    fstream file;
    file.open("file.txt");
    //Read the data from the file
    while(!file.eof())
    {
        string temp;
        file >> temp;
        dictionary.insert(pair<char,string>(temp[0],temp));
    }

    file.close();
    //Print all
    for(auto i: dictionary)
    {
        cout << i.first << ":" << i.second << endl;
    }
    //Print words starting with specific letter
    printLetter('A');

    return 0;
}

答案 1 :(得分:2)

要直接回答您的问题:

std::vector<string> dictionary[26];

dictionary[4]现在是vector

strings(类似于可变长度数组)

但是有更好的方法来存储排序的字典。如果您从不添加单词,则可以将整个内容放入std::vector<std::string>并使用std::sort(dictionary.begin(), dictionary.end())对其进行排序。或者,如果您需要添加/删除单词并保留已排序的列表,您可以使用始终排序的std::set<std::string>(当您插入单词时,它会将其放在适当的位置)

答案 2 :(得分:2)

如果您的编译器支持某些c ++ 11功能

#include <algorithm>
#include <iterator>
#include <string>
#include <vector>

int main()
{       
    std::vector<std::vector<std::string> > dictionary(26);
    //'a' part
    dictionary[0].push_back("alien");
    dictionary[0].push_back("amend");
    dictionary[0].push_back("apple");

    //.......
    //'z' part
    dictionary[25].push_back("zero");
    dictionary[25].push_back("zoo");

    //sort all of the words after insert
    for(auto &strs : dictionary){
        std::sort(std::begin(strs), std::end(strs));
    }

    //find the specific words of 'a'
    auto const it = std::equal_range(std::begin(dictionary[0]), std::end(dictionary[0]), "apple");
    if(it.first != it.second){
        std::cout<<*(it.first)<<std::endl;
    }else{
        std::cout<<"The word do not exist"<<std::endl;
    }           

    return 0;
}

如果没有,则代码会变得有点乏味

#include <algorithm>
#include <string>
#include <vector>

int main()
{       
    std::vector<std::vector<std::string> > dictionary(26);
    //'a' part
    dictionary[0].push_back("alien");
    dictionary[0].push_back("amend");
    dictionary[0].push_back("apple");

    //.......
    //'z' part
    dictionary[25].push_back("zero");
    dictionary[25].push_back("zoo");            

    //you could use std::for_each if you like, I choose for loop because I
    //don't like to write so many trivial functor
    typedef std::vector<std::vector<std::string> >::size_type size_type;
    size_type const size = dictionary.size();
    for(size_type i = 0; i != size; ++i){
       std::sort(dictionary[i].begin(), dictionary[i].end());
    }

    //find the specific words of 'a'
    typedef std::vector<std::string>::const_iterator StrIter;
    std::pair<StrIter, StrIter> it = std::equal_range(dictionary[0].begin(), dictionary[0].end(), "apple");
    if(it.first != it.second){
        std::cout<<*(it.first)<<std::endl;
    }else{
        std::cout<<"The word do not exist"<<std::endl;
    }    

    return 0;
}

答案 3 :(得分:1)

您应该使用Trie Data Structure来存储字典。 here is a C implementation of Trie。你可以很容易地找到C ++

答案 4 :(得分:0)

您可以使用向量数组:std::vector<string> dictionary[26]。这背后的想法与您的第一个相同(除了使用std::vector::push_back()方法向行添加单词;)

答案 5 :(得分:0)

你可以把字典保存在

 std::vector<std::pair< string,std::vector<string> > > 

结构使每个向量元素在向量中包含一个字符和单词列表。