如何优化解析数据流算法?

时间:2013-07-14 11:00:00

标签: c++ algorithm parsing

我需要用C ++实现一些抽象的协议客户端 - 服务器会话解析库。我没有包含整个客户端 - 服务器对话的文件,但必须动态解析它。我必须实现以下接口:

class parsing_class
{
  public:
  void on_data( const char* data, size_t len );
  //other functions
  private:
  size_t pos_;// current position in the data flow
  bool first_part_parsed_;
  bool second_part_parsed_;
  //... some more bool markers or something like vector< bool >
};

数据通过on_data函数传递给我的班级。数据块长度因呼叫而异。我知道协议的数据包格式并知道如何组织对话,因此我可以通过当前pos_判断我是否有足够的数据来解析Nth部分。 现在实现如下:

void parsing_class::on_data( const char* data, size_t len )
{
   pos_ += len;
   if( pos > FIRST_PART_SIZE and !first_part_parsed_ )
     parse_first_part( data, len );
   if( pos > SECOND_PART_SIZE and !second_part_parsed_ )
     parse_second_part( data, len );
   //and so on..  
}

我想要的是如何优化此算法的一些提示。也许要避免这么多ifon_data可能被调用很多次,每次都需要通过所有开关。)

1 个答案:

答案 0 :(得分:1)

您不需要所有boolpos_,因为它们似乎只保留对话内容的状态,以便您可以继续使用下一部分。

以下内容:为对话的每个部分编写一个解析函数

bool parse_part_one(const char *data) {
    ... // parse the data
    next_fun = parse_part_two;
    return true;
}
bool parse_part_two(const char *data) {
    ... // parse the data
    next_fun = parse_part_thee;
    return true;
}
...

并在您的类中添加一个指向当前解析函数的指针,从1开始。现在,在on_data中,您所做的只是调用下一个解析函数

bool success = next_fun(data);

因为每个函数都将指针设置为下一个解析函数,所以on_data的下一次调用将自动调用下一个解析函数。无需测试您在对话中的位置。

如果len的值是关键的(我假设它是),那么也传递它并返回false以指示无法解析该部分(不要更新{ {1}}在这种情况下也是。)