第二次调用函数时出现分段错误?

时间:2017-11-21 06:07:11

标签: c++ string c++11 segmentation-fault stdstring

修改(解决方案)

我已经按照-fsanitize = address&的调试建议进行了操作。 Valgrind的。我只使用-fsanitize(我之前从未听说过)并发现问题是什么,在另一个函数中有一个剩余的调用析构函数,并且对象被销毁了两次。在这一点上,记忆完全受到了损害。

非常感谢帮助和其他建议。

我正在用C ++编写代码以使用套接字与CouchDB交谈(CouchDB是Apache的数据库,具有HTTP API)。我创建了一个完整的类来处理它,它基本上是一个连接和关闭的套接字客户端。

我的一个功能是发送一个HTTP请求,然后读取响应并使用它,它在第一次调用时工作正常,但在第二次调用时失败。

但它失败的地方不一致,有时它在其中一个字符串函数中是SEGFAULT,有时它是返回的SIGABORT。我已用->

标记了它崩溃的行

最糟糕的是,它只会在“第二”时间运行时失败,这实际上是第10次。说明:当实例化类时,创建一个套接字,sendRequest被调用8次(所有工作,总是),我关闭套接字。然后我有另一个控制套接字服务器的类,它接收命令并创建一个执行命令的远程用户对象,然后远程用户命令调用CouchDB类来操作DB。第一次请求命令工作,但第二次失败并崩溃程序。

额外信息:在short int httpcode行中,gdb跟踪显示substr发生崩溃,SIGABORT崩溃跟踪显示free()出现问题。

我已经调试了很多次,对于在何处以及如何实例化字符串和缓冲区进行了一些更改,而我已经丢失了。任何人都知道为什么它可以很好地工作很多次但是在随后的呼叫中崩溃了?

CouchDB::response CouchDB::sendRequest(std::string req_method, std::string req_doc, std::string msg)
{
    std::string responseBody;
    char buffer[1024];
    // zero message buffer
    memset(buffer, 0, sizeof(buffer));

    std::ostringstream smsg;
    smsg << req_method << " /" << req_doc << " HTTP/1.1\r\n"
         << "Host: " << user_agent << "\r\n"
         << "Accept: application/json\r\n"
         << "Content-Length: " << msg.size() << "\r\n"
         << (msg.size() > 0 ? "Content-Type: application/json\r\n" : "")
         << "\r\n"
         << msg;

    /*std::cout << "========== Request ==========\n"
              << smsg.str() << std::endl;*/

    if (sendData((void*)smsg.str().c_str(), smsg.str().size())) {
        perror("@CouchDB::sendRequest, Error writing to socket");
        std::cerr << "@CouchDB::sendRequest, Make sure CouchDB is running in " << user_agent << std::endl;
        return {-1, "ERROR"};
    }

    // response
    int len = recv(socketfd, buffer, sizeof(buffer), 0);

    if (len < 0) {
        perror("@CouchDB::sendRequest, Error reading socket");
        return {-1, "ERROR"};
    }
    else if (len == 0) {
        std::cerr << "@CouchDB::sendRequest, Connection closed by server\n";
        return {-1, "ERROR"};
    }

    responseBody.assign(buffer);
    // HTTP code is the second thing after the protocol name and version
->  short int httpcode = std::stoi(responseBody.substr(responseBody.find(" ") + 1));

    bool chunked = responseBody.find("Transfer-Encoding: chunked") != std::string::npos;
    /*std::cout << "========= Response =========\n"
              << responseBody << std::endl;*/
    // body starts after two CRLF
    responseBody = responseBody.substr(responseBody.find("\r\n\r\n") + 4);

    // chunked means that the response comes in multiple packets
    // we must keep reading the socket until the server tells us it's over, or an error happen
    if (chunked) {
        std::string chunkBody;
        unsigned long size = 1;

        while (size > 0) {
            while (responseBody.length() > 0) {
                // chunked requests start with the size of the chunk in HEX
                size = std::stoi(responseBody, 0, 16);
                // the chunk is on the next line
                size_t chunkStart = responseBody.find("\r\n") + 2;
                chunkBody += responseBody.substr(chunkStart, size);
                // next chunk might be in this same request, if so, there must have something after the next CRLF
                responseBody = responseBody.substr(chunkStart + size + 2);
            }

            if (size > 0) {
                len = recv(socketfd, buffer, sizeof(buffer), 0);

                if (len < 0) {
                    perror("@CouchDB::sendRequest:chunked, Error reading socket");
                    return {-1, "ERROR"};
                }
                else if (len == 0) {
                    std::cerr << "@CouchDB::sendRequest:chunked, Connection closed by server\n";
                    return {-1, "ERROR"};
                }

                responseBody.assign(buffer);
            }
        }
        // move created body from chunks to responseBody
->      responseBody = chunkBody;
    }
    return {httpcode, responseBody};
}

调用上述函数的函数,有时是SIGABORT

bool CouchDB::find(Database::db db_type, std::string keyValue, std::string &value)
{
    if (!createSocket()) {
        return false;
    }
    std::ostringstream doc;
    std::ostringstream json;
    doc << db_name << db_names[db_type] << "/_find";
    json << "{\"selector\":{" << keyValue << "},\"limit\":1,\"use_index\":\"index\"}";
->  CouchDB::response status = sendRequest("POST", doc.str(), json.str());
    close(socketfd);

    if (status.httpcode == 200) {
        value = status.body;
        return true;
    }
    return false;
}

您可能会对以下问题提出疑问:

  • CouchDB::responsestruct {httpcode: int, body: std::string}
  • CouchDB::dbenum选择不同的数据库
  • sendData只发送任何字节,直到发送所有字节为止

1 个答案:

答案 0 :(得分:0)

让它int len = recv(socketfd, buffer, sizeof(buffer), 0);可能会覆盖缓冲区中的最后一个'\0'。有人可能会试图使用sizeof(buffer) - 1,但这可能是错误的,因为您可能在流中获得空字节。所以,请改为:responseBody.assign(buffer, len);。只有在您确认len >= 0之后才能执行此操作,这是您在错误检查中所做的。

您必须在每个呼叫recv的地方执行此操作。但是,您使用recv代替read的原因超出了我的范围,因为您没有使用任何标记。

另外,如果你这样做,你的缓冲区memset毫无意义。您还应该在使用之前声明缓冲区。我必须阅读你的一半功能,以确定你是否做了任何事情。当然,你最后会第二次使用它。

哎呀,既然你的错误处理在两种情况下基本相同,我只会做一个功能就可以了。不要重复自己。

最后,你使用find的结果快速而宽松地玩。你可能实际上找不到你正在寻找的东西,而是可能会找回string::npos,这也会引起你有趣的问题。

另外,如果您正在使用gcc或clang,请尝试-fsanitize=address(或其中记录的其他一些清理选项)。和/或在valgrind下运行它。您的内存错误可能远离崩溃的代码。那些可能会帮助你接近它。

而且,最后一点。你的逻辑完全搞砸了。您必须将读取数据和解析分开,并为每个数据保留不同的状态机。无论您的读取有多大,都无法保证您的第一次读取会获得整个HTTP标头。并且无法保证您的标题也不会超过一定的大小。

您必须继续阅读,直到您阅读的内容比您更愿意阅读标题并将其视为错误,或者直到您在标题末尾获得CR LN CR LN。

这些最后一位不会导致代码崩溃,但会导致虚假错误,尤其是在某些流量情况下,这意味着它们可能不会出现在测试中。