如何将文件解析为标记向量?

时间:2017-02-22 23:35:07

标签: c++ token

所以我想要做的是创建一个c ++函数,它读入一个文件并将该文件的文本转换为一个标记向量。

现在我的文本文件需要很多分隔符,包括句点,引号等等。所以我认为strtok比sstream更好地读取令牌。然而,当我遍历我的矢量时,我注意到它里面没有任何东西。代码出现空白。我究竟做错了什么?

请帮帮我!

我的代码在这里:

void getTokenFreq(string inFile_name) {
ifstream inFile;
int n = 0;
char *token;
vector<string> result(1);

inFile.open(inFile_name);

if (inFile.fail()){
    cout << "Fail to open the file tmp.txt.\n";
    exit(-1);
}

while(inFile.good()) {
    getline(inFile, s);
    char *str = new char[s.length() + 1];
    strcpy(str, s.c_str());
    token = strtok(str, " ’—\",;.:?“”");
    while (token != NULL) {
        result.push_back();
        token = strtok (NULL, " ’—\",;.:?“”");
        n++;
    }
}

for(int i = 0; i < n; i++) {
    cout << result[i];
}

inFile.close();

}

1 个答案:

答案 0 :(得分:-1)

你很好,除了一些错误:

首先:

vector<string> result(1);

为什么一开始会有一个空的std::string?这会打破你的矢量,结果就像:"", "one", "two", "three", ...。 将其更改为:

vector<string> result;

第二

result.push_back();

您无法在没有参数的情况下调用push_back。根据您的计划逻辑,您应该push_back token,因此请将其更改为:

result.push_back(token);

第三

你没有释放分配的内存。在内心之后,请致电:

delete [] str;

此外,std::string s在您的函数中不可见,但我认为它是全局的。