基于输入向量

时间:2015-06-16 21:09:57

标签: c++ c++11 vector stl idioms

在一个小应用程序中,我一直使用std::vector std::vector<std::string>临时存储 一些数据(从非SQL数据库中提取),然后处理它并将其上传到SQL数据库。不幸, 我从中提取数据的API不一定按查询指定的顺序返回字段; 例如如果我的查询请求字段x, y, z,则数据可能会以y, x, zz, y, x等方式返回...显然 这是有问题的,因为如果目标SQL表的列是x, y, z,则插入的数据需要 反映这一点。

为了解释这个随机字段排序,我编写了一个小函数,它接受(1)API返回的输入数据; (2)表示所需列排序的std::vector<std::string>,如SQL表中所定义 - 和 相应地重新排序每个子向量的元素。由于输入数据的第一行是字段矢量 名称,我能够将它与正确有序向量进行比较,并确定每个子向量应该如何 重新排序:

void fix_order(std::vector<std::vector<std::string>>& data, const std::vector<std::string>& correct) {

  std::size_t width = data[0].size();
  std::vector<int> order_idx(width);

  for (std::size_t i = 0; i < width; i++) {
    std::string tmp(data[0].at(i));
    auto pos = std::find(correct.begin(), correct.end(), tmp);
    order_idx[i] = std::distance(correct.begin(), pos);
  }

  for (std::size_t i = 0; i < data.size(); i++) {
    if (!data[i].empty()) {
      std::vector<std::string> q(width);

      for (unsigned int j = 0; j < width; j++) {
        int new_pos = order_idx[j];
        q[new_pos] = data[i].at(j);
      }
      std::swap(data[i], q);
    }
  }
}

在操作中,如果输入数据字段按second, fourth, first, third排序,并且我将指定正确顺序的向量传递为first, second, third, fourth,则转换如下所示:

Before:
    second  fourth  first   third
    2nd     4th     1st     3rd
    2nd     4th     1st     3rd

After:
    first   second  third   fourth
    1st     2nd     3rd     4th
    1st     2nd     3rd     4th

虽然该函数产生了所需的结果,但我的循环和STL算法的混合感觉很草率,一般来说不太可读。在其他情况下,我通常能够使用std::sort自定义比较器函数进行非标准排序,但我无法弄清楚如何在此处调整此方法,其中“排序”由预定义确定输入,而不是某种类型的基于比较的逻辑。有没有更惯用的方法来实现这一点 - 即更好地使用STL算法(不一定是std::sort)或其他C ++习语?

这是一个online demo来重现这种情况。

1 个答案:

答案 0 :(得分:2)

如果转置数据,就像通过其中第一个元素的索引对向量进行排序一样简单。这将比您的解决方案慢,但可能更具可读性:

void fix_order(std::vector<std::vector<std::string>>& data, const std::vector<std::string>& correct) {
    // setup index map, e.g. "first" --> 0
    std::unordered_map<std::string, size_t> idx;
    for (size_t i = 0; i < correct.size(); ++i) {
        idx.insert(std::make_pair(correct[i], i));
    }

    // transpose for efficient sorting 
    auto tp = transpose(std::move(data));

    // sort based on index map
    std::sort(tp.begin(), tp.end(), [&](const std::vector<std::string>& lhs, const std::vector<std::string>& rhs){
        return idx[lhs[0]] < idx[rhs[0]];
    });

    // transpose back to get the form you wanted  
    data = transpose(std::move(tp));
}

transpose只是:

std::vector<std::vector<std::string>> transpose(std::vector<std::vector<std::string>>&& data)
{
    std::vector<std::vector<std::string>> result(data[0].size(),
           std::vector<std::string>(data.size()));

    for (size_t i = 0; i < data[0].size(); ++i) {
        for (size_t j = 0; j < data.size(); ++j) {
            result[i][j] = std::move(data[j][i]);
        }
    }

    return result;
}