我有这个载体
vector <string> data
data = ["this is", "data that", "is in", "this is", "vector", "vector", "vector"]
如何获得一个矢量(或二维数组)去除重复项,而不是每个第i个条目的计数?
即
results = [("this is", 2), ("data that", 1), ("is in", 1), ("vector", 3)]
答案 0 :(得分:5)
直接的解决方案是将唯一值及其计数累积到地图中:
std::map<std::string, std::size_t> results;
std::for_each(begin(data), end(data), [&](std::string const& s)
{
++results[s];
});
这具有线性(n lg n)时间复杂度,但因为它必须复制每个不同的字符串值,所以它可能相当昂贵。您还可以就地对列表进行排序,然后计算每个值的数量,如果您有std::string
的移动感知实现,这可能会更好。