在一个小应用程序中,我一直使用std::vector
std::vector<std::string>
临时存储
一些数据(从非SQL数据库中提取),然后处理它并将其上传到SQL数据库。不幸,
我从中提取数据的API不一定按查询指定的顺序返回字段;
例如如果我的查询请求字段x, y, z
,则数据可能会以y, x, z
或z, y, x
等方式返回...显然
这是有问题的,因为如果目标SQL表的列是x, y, z
,则插入的数据需要
反映这一点。
为了解释这个随机字段排序,我编写了一个小函数,它接受(1)API返回的输入数据;
(2)表示所需列排序的std::vector<std::string>
,如SQL表中所定义 - 和
相应地重新排序每个子向量的元素。由于输入数据的第一行是字段矢量
名称,我能够将它与正确有序向量进行比较,并确定每个子向量应该如何
重新排序:
void fix_order(std::vector<std::vector<std::string>>& data, const std::vector<std::string>& correct) {
std::size_t width = data[0].size();
std::vector<int> order_idx(width);
for (std::size_t i = 0; i < width; i++) {
std::string tmp(data[0].at(i));
auto pos = std::find(correct.begin(), correct.end(), tmp);
order_idx[i] = std::distance(correct.begin(), pos);
}
for (std::size_t i = 0; i < data.size(); i++) {
if (!data[i].empty()) {
std::vector<std::string> q(width);
for (unsigned int j = 0; j < width; j++) {
int new_pos = order_idx[j];
q[new_pos] = data[i].at(j);
}
std::swap(data[i], q);
}
}
}
在操作中,如果输入数据字段按second, fourth, first, third
排序,并且我将指定正确顺序的向量传递为first, second, third, fourth
,则转换如下所示:
Before:
second fourth first third
2nd 4th 1st 3rd
2nd 4th 1st 3rd
After:
first second third fourth
1st 2nd 3rd 4th
1st 2nd 3rd 4th
虽然该函数产生了所需的结果,但我的循环和STL算法的混合感觉很草率,一般来说不太可读。在其他情况下,我通常能够使用std::sort
自定义比较器函数进行非标准排序,但我无法弄清楚如何在此处调整此方法,其中“排序”由预定义确定输入,而不是某种类型的基于比较的逻辑。有没有更惯用的方法来实现这一点 - 即更好地使用STL算法(不一定是std::sort
)或其他C ++习语?
这是一个online demo来重现这种情况。
答案 0 :(得分:2)
如果转置数据,就像通过其中第一个元素的索引对向量进行排序一样简单。这将比您的解决方案慢,但可能更具可读性:
void fix_order(std::vector<std::vector<std::string>>& data, const std::vector<std::string>& correct) {
// setup index map, e.g. "first" --> 0
std::unordered_map<std::string, size_t> idx;
for (size_t i = 0; i < correct.size(); ++i) {
idx.insert(std::make_pair(correct[i], i));
}
// transpose for efficient sorting
auto tp = transpose(std::move(data));
// sort based on index map
std::sort(tp.begin(), tp.end(), [&](const std::vector<std::string>& lhs, const std::vector<std::string>& rhs){
return idx[lhs[0]] < idx[rhs[0]];
});
// transpose back to get the form you wanted
data = transpose(std::move(tp));
}
transpose
只是:
std::vector<std::vector<std::string>> transpose(std::vector<std::vector<std::string>>&& data)
{
std::vector<std::vector<std::string>> result(data[0].size(),
std::vector<std::string>(data.size()));
for (size_t i = 0; i < data[0].size(); ++i) {
for (size_t j = 0; j < data.size(); ++j) {
result[i][j] = std::move(data[j][i]);
}
}
return result;
}