Question

所以以前我只需要查找一把钥匙，所以我可以使用地图：

std::map <int, double> freqMap;

但是现在我需要查找2个不同的键。我正在考虑使用带有std :: pair的向量，即：

std::vector <int, std::pair<int, double>> freqMap;

最终，我需要查找两个键以找到正确的值。有没有更好的方法可以做到这一点，或者这样做是否足够有效（将有约3000个条目）。另外，不确定如何使用第二个键（std :: pair中的第一个键）进行搜索。根据第一把钥匙找到一对吗？基本上，我可以通过以下方式访问第一个密钥：

freqMap[key1]

但不确定如何迭代并找到配对中的第二把钥匙。

编辑：可以添加用例进行说明：

我需要基于2个键，一个多路复用器选择和一个频率选择来查找一个val。原始数据如下所示：

Mux, Freq, Val
0, 1000, 1.1
0, 2000, 2.7
0, 10e9, 1,7
1, 1000, 2.2
1, 2500, 0.8
6, 2000, 2.2

Answer 1

“更快”的总括答案通常是“您必须对其进行基准测试”。

但是除此之外，您还有许多选择。 std::map比纸上的其他数据结构更有效，但实际上不一定。如果您确实处于对性能至关重要的情况下（即避免过早优化），请尝试以下所示的不同方法，并评估您获得的性能（从内存和CPU角度）。

可以考虑将您的数据放入std::map中，给它取适当的名称，然后将所有值存储在简单的std::vector中，而不是使用struct。如果很少修改数据，则您可以根据通常用于查找条目的关键字sorting来binary search来优化检索成本，但要付出额外的插入成本。这将使您能够执行linear search，这比cache locality快得多。

但是，由于branch和prediction std::array，在std::vector上进行线性搜索的速度惊人地快。处理地图，unordered_map或（二进制搜索的）排序向量时，这两种方法都可能会丢失。因此，尽管O（n）听起来比map的O（log n）或unordered_map的O（1）听起来要可怕得多，但在适当的条件下它可能仍然更快。 >

尤其是如果您发现没有可用于分类条目的可辨别索引成员，则必须坚持在连续内存（即向量）中进行线性搜索（<向量>）或放入双索引数据结构（实际上类似于两个映射或两个unordered_maps）。具有两个索引通常会阻止您使用单个地图/ unordered_map。

如果您可以更紧密地打包数据（例如，您需要int还是需要std::uint8_t做这项工作，是否需要double？等等），您将放大缓存的局部性，对于只有3k的条目，您很有可能使未排序的向量表现最佳。尽管std::size_t自身的操作通常比较小类型的操作要快，但是对连续内存进行迭代通常可以抵消这种影响。

结论：尝试使用未排序的向量，已排序的向量（+二进制搜索），地图和unordered_map。做适当的基准测试（重复几次）并选择最快的基准测试。如果没有什么不同，请选择最简单明了的方法。

编辑：给定您的示例数据，听起来第一个键的域非常小。据我所知，“ Mux”似乎仅限于彼此接近的少量不同值，在这种情况下，您可以考虑使用documentation作为主要索引结构并进行适当的查找结构作为您的第二个。例如：

std::array<std::vector<std::pair<std::uint64_t,double>>,10>
std::array<std::unordered_map<std::uint64_t,double>,10>

C ++在<int，pair>的向量中查找

1 个答案: