我需要计算字符串中的字母,按计数和cout
结果对它们进行排序。为此,我尝试使用vector
和struct
。这是我的代码的一部分,但它不起作用,因为我不知道如何实现某些东西:
#include <iostream>
#include <string>
#include <vector>
#include <algorithm>
using namespace std;
struct int_pair{
int key;
int value;
};
bool sort_by_value(int_pair left, int_pair right){
return left.value < right.value;
}
int main() {
string characters = "aasa asdfs dfh f ukjyhkh k wse f sdf sdfsdf";
vector<int_pair> most_frequent;
for (string::size_type i = 0; i <= characters.length(); i++) {
int int_char = (int)characters[i];
most_frequent[int_char]++; <-- I want to do something like this, but it's not working
}
sort(most_frequent.begin(), most_frequent.end(), sort_by_value);
for (vector<int_pair>::iterator it = most_frequent.begin(); it != most_frequent.end(); ++it) <-- is this call correct?
cout << " " << it->key << ":" << it->value << endl;
return 0;
}
在这段代码中,我有两部分,我不知道如何处理:
most_frequent[int_char]++; <-- I want to do something like this, but it's not working
和
for (vector<int_pair>::iterator it = most_frequent.begin(); it != most_frequent.end(); ++it) <-- is this call correct?
也许您可以在此代码中看到任何其他错误和潜在问题。
答案 0 :(得分:4)
我会使用std :: map来确定每个字母的频率,然后将其复制到多图中,同时反转键和值以使它们按顺序排列。
#include <iostream>
#include <map>
#include <algorithm>
template<class T, class U>
std::pair<U,T> flip_pair(const std::pair<T,U>& p) {
return std::make_pair(p.second,p.first);
}
int main(){
std::string characters = "zxcvopqiuweriuzxchajksdui";
std::map<char,int> freq;
std::multimap<int,char> rev_freq;
// Calculate the frequency of each letter.
for(char c: characters){
freq[c]++;
}
// Copy the results into a multimap with the key and value flipped
std::transform(std::begin(freq), std::end(freq),
std::inserter(rev_freq, rev_freq.begin()),
flip_pair<char,int>);
// Print out the results in order.
for(std::pair<int,char> p : rev_freq){
std::cout << p.first << ": " << p.second << std::endl;
}
};
答案 1 :(得分:2)
这应该做你需要的:
most_frequent[int_char].key = int_char;
most_frequent[int_char].value++;
是的,它会多次设置key
,即使它不需要。
答案 2 :(得分:1)
使用密钥访问容器时(vector
使用整数索引,在您的情况下是“密钥”),您不必再次将密钥存储在容器的值字段中
因此您不需要struct
,因为您只需要值字段,并且可以直接在向量中存储出现次数。
这个想法是在开头用256个整数填充向量,所有这些都初始化为零。然后,使用向量索引作为“密钥”(字符代码)来访问元素(出现次数)。
这将产生类似于此的代码:
// initialize with 256 entries, one for each character:
vector<int> counts(256);
for (string::size_type i = 0; i <= characters.length(); i++) {
// for each occurrence of a character, increase the value in the vector:
int int_char = (int)characters[i];
counts[int_char]++;
}
完成矢量填充后,您可以使用std::max_element
算法找到最大值(不仅是值,还包括存储它的键):
vector<int>::iterator most_frequent =
std::max_element(counts.begin(), counts.end());
// getting the character (index within the container, "key"):
std::cout << (char)(most_frequent - counts.begin());
// the number of occurrences ("value"):
std::cout << (*most_frequent);
以下是您更改的示例(仅打印最常用的字符,此处为空格,因此您看不到它):http://ideone.com/94GfZz
你可以对这个向量进行排序,但是,当然你会松开键,因为元素会移动并改变它们的索引。有一个很好的技巧来处理这样的统计数据:使用反向(多)地图(键,值反转):
multimap<int,int> keyForOccurrence;
for (vector<int>::iterator i = counts.begin(); i != counts.end(); ++i) {
int occurrences = *i;
int character = i - counts.begin();
keyForOccurrence.insert(std::pair<int,int>(occurrences, character));
}
更新了代码:http://ideone.com/Ub5rnL
您现在应该自己解决的最后一件事是如何访问和处理此地图中的数据。关于这个反转地图的奇特之处在于它现在会按出现自动排序,因为地图按键排序。
答案 3 :(得分:1)
我发现使用 std::map
容器存储每个字符的次数更为自然。字符是地图的键,其出现次数是地图的值。
可以使用std::map::operator[]
和++
轻松扫描源字符串并构建此地图,以增加发生次数。
然后,您可以从上面的地图构建第二个地图,其中键和值已反转:因此此地图将按出现次数排序,然后您可以打印这第二张地图。
请注意,您必须使用std::multimap
作为第二个映射,因为它的键(即出现次数)可以重复。
示例代码如下(我使用VS2010 SP1 / VC10进行了测试):
#include <stddef.h> // for size_t
#include <algorithm> // for std::transform
#include <functional> // for std::greater
#include <iostream> // for std::cout
#include <iterator> // for std::inserter
#include <map> // for std::map, std::multimap
#include <ostream> // for std::endl
#include <string> // for std::string
#include <utility> // for std::pair
using namespace std;
int main()
{
string str = "aasa asdfs dfh f ukjyhkh k wse f sdf sdfsdf";
// Build the occurrences map (char -> occurrences)
map<char, size_t> freq;
for (size_t i = 0; i < str.length(); ++i)
freq[ str[i] ]++;
// Build a new map from previous map with inverted <key, value> pairs,
// so this new map will be sorted by old map's value (i.e. char's
// occurrences), which is new map's key.
// Use the std::greater comparator to sort in descending order.
multimap<size_t, char, greater<size_t>> sorted_freq;
transform(
freq.begin(), freq.end(), // source
inserter(sorted_freq, sorted_freq.begin()), // destination
[](const pair<char, size_t>& p) // invert key<->value
{
return pair<size_t, char>(p.second, p.first);
}
);
// Print results
for (auto it = sorted_freq.begin(); it != sorted_freq.end(); ++it)
cout << it->second << ": " << it->first << endl;
}
输出:
: 9 s: 7 f: 7 d: 5 a: 4 k: 3 h: 3 u: 1 w: 1 y: 1 j: 1 e: 1
如果您不想打印空格字符,可以轻松过滤掉。
请注意,对于非ASCII字符,使用std::map
/ std::multimap
也会比std::vector
更好地扩展,例如如果您使用Unicode UTF-32(因为Unicode字符远远超过256)。