读取二进制数据以查找十六进制序列

时间:2018-06-19 23:32:18

标签: c++ linux binary byte ifstream

我有一个要从中读取的二进制文件,并且文件内部是不固定的数据长度,但是它们确实具有开始和结束序列。

开始顺序为0x1B 0x5B 0x30 0x48
停止顺序为0x1b 0x5B 0x31 0x48

这个特定的文件中确实包含28个条目,并考虑了多少个条目可以不同。

我已经将二进制文件读入到文件大小的向量中

ifstream datafile("myfile.bin", ios_base::in|ios_base::binary);
vector<char> buff;
int size = datafile.tellg();
buff.resize(size);

datafile.read(buff.data(), size);

现在,我尝试逐字节遍历向量(因为它是如何存储在向量中的,对吧?但这不是我想要的。)

读完将数据写入另一个(temp)变量的向量,然后在看到Stop Sequence时停止对其进行写入,将是很好的选择。然后继续执行向量的其余部分,写入另一个变量,直到看到下一个Stop Sequence等。就像写入vector<vector<char>>吗?

下面是我逐字节进行的迭代。

for (vector<char>::iterator it = buff.begin(); it != buff.end(); ++it)
{
  if (*it == 0x1B)
  {
    // found ESC char
  }
}

我应该如何设置从二进制文件读取,将字节写到停止序列,然后重复文件的其余部分?

2 个答案:

答案 0 :(得分:1)

我编写了一些示例代码,该代码扫描给定的字节向量,并将在开始/停止序列之间找到的字节游程存储到字节向量的向量中。

还没有真正测试过它,但是它确实可以编译:-)

void findSequences( vector< char >& buff, vector< vector< char > > *dataRuns )
{
  char startSequence[] = { 0x1B, 0x5B, 0x30, 0x48 };
  char endSequence[] = { 0x1b, 0x5B, 0x31, 0x48 };

  bool findingStart = true;

  vector< char >::iterator it = buff.begin();
  vector< char >::iterator itEnd = buff.end();
  while ( it != itEnd )
  {
    vector< char >::iterator findIt;
    if ( findingStart )
      findIt = search( it, itEnd, startSequence, startSequence + 4 );
    else
      findIt = search( it, itEnd, endSequence, endSequence + 4 );

    if ( findIt != itEnd )
    {
      if ( findingStart )
      {
        it = findIt + 4;
        findingStart = false;
      }
      else
      {
        dataRuns->push_back( vector< char >( it, findIt ) );
        it = findIt + 4;
        findingStart = true;
      }
    }
    else
    {
      // failed to find a start or stop sequence

      break;
    }
  }
}

答案 1 :(得分:1)

该格式对我来说错误。如果您的数据包含开始/结束序列怎么办?您如何编码它们?

您过于依赖stl。您无需将输入读入vector。编写一个函数,使用istream::getistream::unget从流中提取令牌。这可能是您必须编写的最复杂的函数。您的函数必须返回的令牌为:

  • data-begin :您的开始转义序列。
  • data :一个数据字节。
  • data-end :您的结束转义序列。
  • done :流的结尾。

此功能将使数据提取变得简单:

bool reader_t::get_data( std::vector< char >& d ) // returns false on end of stream
{
  d.clear();

  get_token();

  if ( _tok == done )
    return false; // end of stream

  if ( _tok != data_beg )
    throw "data begin expected";

  while ( get_token() == data )
    d.push_back( _c );

  if ( _tok != data_end )
    throw "data end expected";

  return true;
}

处理,整个流也很简单:

int main()
{
  std::ifstream is { R"(d:\temp\test.bin)" };
  if ( !is )
    return 0;

  reader_t r { is };
  std::vector< char > v;
  try
  {
    while ( r.get_data( v ) )
      ;// process v;
  }
  catch ( const char* e )
  {
    std::cout << e;
  }

  return 0;
}

这是您的阅读器的外观:

class reader_t
{
  std::istream& _is;

  enum token_t
  {
    data_beg,
    data_end,
    data,
    done
  };

  token_t _tok;
  char _c;

  token_t get_token();

public:

  reader_t( std::istream& a_is );
  bool get_data( std::vector< char >& d ) // returns false on end of stream
};

这是急忙写的 demo -不作保证。