使用模式正则表达式匹配对目录列表进行排序

时间:2011-07-13 14:23:06

标签: c++ regex sorting boost filesystems

我使用boost-filesystem和boost-regexp来使用以下代码片段来获取作为参数输入的目录中的绝对路径+文件名。

其中input_dir是从命令行保存参数的变量,表示要遍历的目录的名称,

  string dir_abs_name = "./" + input_dir;
  string file_abs_name;
  path current_dir(dir_abs_name);
  boost::regex pattern("m.*"); // list all files starting with m

  for (directory_iterator iter(current_dir),end; iter!=end; ++iter) {
    string name = iter->path().leaf();
    if (regex_match(name, pattern)) {
      file_abs_name = dir_abs_name + name;
      input_file = str_to_char(file_abs_name); // my own function that converts string to char* (needed that for another method later on in the code)

      std::cout << "--> considering file " << input_file << "... \n";
    }
  }

现在我遇到的问题是列表不是按字母顺序排列的。我得到随机匹配,而不是按任何特定顺序。有没有办法强制按字母顺序排列?

感谢。

编辑:值得一提的是,在程序中,我有时只处理目录中整个文件列表的一部分。当我传递一个参数进行选择时,我这样做,假设目录中只有1000个文件中的4个文件。可以在检索列表后对它们进行排序..但检索仍然是随机的。

1 个答案:

答案 0 :(得分:3)

为什么不将结果缓存在一个(std :: vector)中,对向量进行排序,然后遍历已排序的向量来执行处理?

例如:

string dir_abs_name = "./" + input_dir;
string file_abs_name;   
path current_dir(dir_abs_name);   
boost::regex pattern("m.*"); // list all files starting with m
std::vector<std::string> accumulator;
for (directory_iterator iter(current_dir),end; iter!=end; ++iter) {     
    string name = iter->path().leaf();
    if (regex_match(name, pattern)) {
       file_abs_name = dir_abs_name + name; 
       accumulator.push_back(file_abs_name);
    }   
}
std::sort(accumulator.begin(), accumulator.end());
std::vector<std::string>::iterator iter;
for (iter = accumulator.begin(); iter != accumulator.end(); ++iter) {
    char* input_file = str_to_char(*iter); // my own function that converts string to char* (needed that for another method later on in the code)                            
    std::cout << "--> considering file " << input_file << "... \n"; 
}