在下面的示例中,std :: map结构填充了来自A - Z(对于键)的26个值和对于值的0 - 26。 (在我的系统上)查找最后一个条目(10000000次)的时间对于向量大约为250毫秒,对于映射大约为125毫秒。 (我使用发布模式编译,为g ++ 4.4启用了O3选项)
但是,如果由于一些奇怪的原因我想要比std :: map更好的性能,我需要考虑使用哪些数据结构和函数?
如果答案对您来说显而易见,我深表歉意,但我对C ++编程的性能关键方面没有太多经验。
#include <ctime>
#include <map>
#include <vector>
#include <iostream>
struct mystruct
{
char key;
int value;
mystruct(char k = 0, int v = 0) : key(k), value(v) { }
};
int find(const std::vector<mystruct>& ref, char key)
{
for (std::vector<mystruct>::const_iterator i = ref.begin(); i != ref.end(); ++i)
if (i->key == key) return i->value;
return -1;
}
int main()
{
std::map<char, int> mymap;
std::vector<mystruct> myvec;
for (int i = 'a'; i < 'a' + 26; ++i)
{
mymap[i] = i - 'a';
myvec.push_back(mystruct(i, i - 'a'));
}
int pre = clock();
for (int i = 0; i < 10000000; ++i)
{
find(myvec, 'z');
}
std::cout << "linear scan: milli " << clock() - pre << "\n";
pre = clock();
for (int i = 0; i < 10000000; ++i)
{
mymap['z'];
}
std::cout << "map scan: milli " << clock() - pre << "\n";
return 0;
}
答案 0 :(得分:8)
对于您的示例,请使用int value(char x) { return x - 'a'; }
更通用,因为“键”是连续且密集的,所以使用数组(或向量)来保证Θ(1)访问时间。
如果您不需要对密钥进行排序,use unordered_map
,这应该为大多数操作提供摊销的对数改进(即O(log n) - > O(1))。
(有时,特别是对于小数据集,线性搜索比哈希表(unordered_map)/平衡二叉树(map)更快,因为前者具有更简单的算法,因此减少了big-O中的隐藏常量。 ,个人资料,个人资料。)
答案 1 :(得分:2)
对于初学者,如果要比较搜索时间,则应该使用std::map::find
; operator[]
除了常规查找之外还有其他功能。
此外,您的数据集非常小,这意味着整个矢量很容易适应处理器缓存;许多现代处理器都针对这种强力搜索进行了优化,因此您最终会获得相当不错的性能。地图虽然理论上具有更好的性能(O(log n)而不是O(n))但是不能真正利用其较少数量的比较的优势,因为没有那么多的密钥要比较它的开销和它的开销数据布局不利于它。
TBH对于数据结构这么小,不使用向量的额外性能增益通常可以忽略不计。当您处理大量数据和正在搜索的分布良好的数据集时,std::map
等“更智能”的数据结构就会发挥作用。
答案 2 :(得分:2)
如果您真的只有从A到Z的所有条目的值,为什么不使用字母(正确调整)作为向量的索引?:
std::vector<int> direct_map;
direct_map.resize(26);
for (int i = 'a'; i < 'a' + 26; ++i)
{
direct_map[i - 'a']= i - 'a';
}
// ...
int find(const std::vector<int> &direct_map, char key)
{
int index= key - 'a';
if (index>=0 && index<direct_map.size())
return direct_map[index];
return -1;
}