C ++在<int,pair>的向量中查找

时间:2020-08-28 16:24:23

标签: c++ vector find key-value std-pair

所以以前我只需要查找一把钥匙,所以我可以使用地图:

std::map <int, double> freqMap;

但是现在我需要查找2个不同的键。我正在考虑使用带有std :: pair的向量,即:

std::vector <int, std::pair<int, double>> freqMap;

最终,我需要查找两个键以找到正确的值。有没有更好的方法可以做到这一点,或者这样做是否足够有效(将有约3000个条目)。另外,不确定如何使用第二个键(std :: pair中的第一个键)进行搜索。根据第一把钥匙找到一对吗?基本上,我可以通过以下方式访问第一个密钥:

freqMap[key1]

但不确定如何迭代并找到配对中的第二把钥匙。

编辑:可以添加用例进行说明:

我需要基于2个键,一个多路复用器选择和一个频率选择来查找一个val。原始数据如下所示:

Mux, Freq, Val
0, 1000, 1.1
0, 2000, 2.7
0, 10e9, 1,7
1, 1000, 2.2
1, 2500, 0.8
6, 2000, 2.2

1 个答案:

答案 0 :(得分:3)

“更快”的总括答案通常是“您必须对其进行基准测试”。

但是除此之外,您还有许多选择。 std::map比纸上的其他数据结构更有效,但实际上不一定。如果您确实处于对性能至关重要的情况下(即避免过早优化),请尝试以下所示的不同方法,并评估您获得的性能(从内存和CPU角度)。


可以考虑将您的数据放入std::map中,给它取适当的名称,然后将所有值存储在简单的std::vector中,而不是使用struct。如果很少修改数据,则您可以根据通常用于查找条目的关键字sortingbinary search来优化检索成本,但要付出额外的插入成本。这将使您能够执行linear search,这比cache locality快得多。

但是,由于branchprediction std::array,在std::vector上进行线性搜索的速度惊人地快。处理地图,unordered_map或(二进制搜索的)排序向量时,这两种方法都可能会丢失。因此,尽管O(n)听起来比map的O(log n)或unordered_map的O(1)听起来要可怕得多,但在适当的条件下它可能仍然更快。 >

尤其是如果您发现没有可用于分类条目的可辨别索引成员,则必须坚持在连续内存(即向量)中进行线性搜索(<向量>)或放入双索引数据结构(实际上类似于两个映射或两个unordered_maps)。具有两个索引通常会阻止您使用单个地图/ unordered_map。

如果您可以更紧密地打包数据(例如,您需要int还是需要std::uint8_t做这项工作,是否需要double?等等),您将放大缓存的局部性,对于只有3k的条目,您很有可能使未排序的向量表现最佳。尽管std::size_t自身的操作通常比较小类型的操作要快,但是对连续内存进行迭代通常可以抵消这种影响。


结论:尝试使用未排序的向量,已排序的向量(+二进制搜索),地图和unordered_map。做适当的基准测试(重复几次)并选择最快的基准测试。如果没有什么不同,请选择最简单明了的方法。


编辑:给定您的示例数据,听起来第一个键的域非常小。据我所知,“ Mux”似乎仅限于彼此接近的少量不同值,在这种情况下,您可以考虑使用documentation作为主要索引结构并进行适当的查找结构作为您的第二个。例如:

std::array<std::vector<std::pair<std::uint64_t,double>>,10>
std::array<std::unordered_map<std::uint64_t,double>,10>