无缝地知道包含空字符

时间:2016-07-03 12:07:12

标签: c++ string macros null-character

一个非常简单的问题的长期问题菜鸟问题但是我需要一些建议。

背景

所以我有一个需要解析的二进制文件。此文件以包含空字符(\0)的一些魔术字符串开头。我们的定义是ab\0cd

我正在编写一个方法,如果某个文件以魔术字符串开头,则返回true。

尝试1

#define MAGIC_STRING "ab\0cd"

bool IsMagicFile(const wpath& pathFile)
{
    string strData;
    if (!ReadFile(pathFile, strData))
        return false;

    if (strData.size() < 5)
        return false;

    string strPrefix = strData.substr(0, 5);

    if (strcmp(strPrefix.c_str(), MAGIC_STRING) != 0)
        return false;

    return true;
}

问题1

令我困扰的是上面的代码是我&#34;硬编码&#34;假设魔术字符串的大小为5

如果明天魔术弦会发生变化怎么办?说:

#define MAGIC_STRING "abe\0fcd"

字符串宏发生了变化,代码没有longers正常工作。

尝试2

#define MAGIC_STRING "ab\0cd"

bool IsMagicFile(const wpath& pathFile)
{
    string strMagic = MAGIC_STRING;

    string strData;
    if (!ReadFile(pathFile, strData))
        return false;

    if (strData.size() < strMagic.size())
        return false;

    string strPrefix = strData.substr(0, strMagic.size());

    if (strcmp(strPrefix.c_str(), MAGIC_STRING) != 0)
        return false;

    return true;
}

问题2

我认为摆脱了硬编码的大小问题但是strMagic的大小实际上不是5但是2.字符串以\0

结尾

尝试3

#define MAGIC_STRING        "ab\0cd"    // CAUTION - MAGIC_STRING & MAGIC_STRING_SIZE must be changes together 
#define MAGIC_STRING_SIZE   5           // CAUTION - MAGIC_STRING & MAGIC_STRING_SIZE must be changes together

bool IsMagicFile(const wpath& pathFile)
{
    string strData;
    if (!ReadFile(pathFile, strData))
        return false;

    if (strData.size() < MAGIC_STRING_SIZE)
        return false;

    string strPrefix = strData.substr(0, MAGIC_STRING_SIZE);

    if (strcmp(strPrefix.c_str(), MAGIC_STRING) != 0)
        return false;

    return true;
}

问题3

这解决了第一个问题,但我仍然没有得到我想要的无缝魔法字符串更改。

问题

尝试3是否足够好?你有更好的方法吗?

3 个答案:

答案 0 :(得分:2)

您可以定义一个常量字符数组,而不是使用宏定义。例如

const char MAGIC_STRING[] = "abe\0fcd";

在这种情况下,除终止零之外的字符数等于

sizeof( MAGIC_STRING ) - 1

要比较原始字节,您可以使用标准C函数memcmp,提供与上述表达式相等的比较字节数。

这是一个示范程序

#include <iostream>
#include <string>
#include <cstring>
#include <iterator>

const char MAGIC_STRING[] = "abe\0fcd";

int main() 
{
    std::string s( std::begin( MAGIC_STRING ), std::prev( std::end( MAGIC_STRING ) )  );

    if ( memcmp( s.c_str(), MAGIC_STRING, sizeof( MAGIC_STRING ) - 1 ) == 0 )
    {
        std::cout << "The string starts with the MAGIC_STRING" << std::endl;
    }

    return 0;
}

它的输出是

The string starts with the MAGIC_STRING

答案 1 :(得分:0)

如果您知道您的魔术字符串将包含\0,那么您可以编写自己的size(string str)函数,通过在第一个\0之后继续计数来返回正确的长度

如果不知道魔法弦中有多少\0,我建议你尝试3。

如果您需要一些代码来指导您使用size方法的正确方向,请与我们联系。

答案 2 :(得分:0)

我个人会避免使用MACROS。另外,我不会使用为空终止字符串设计的函数,如std::strcmp。您可以使用标准<algorithm>库中的std::equal检查字符串的开头是否包含特定字符序列:

// create a character array to preserve compile time size
// but remember string literals add a null-terminator extra character
const char magic_string[] = "ab\0cd";

bool IsMagicFile(const wpath& pathFile)
{
    string strData;
    if (!ReadFile(pathFile, strData))
        return false;

    // -1 to avoid null terminator from magic_string character array
    return std::equal(magic_string, magic_string + sizeof(magic_string) - 1,
        strData.begin());
}