我有几个字符串2000 - 3000个字符的长度,我想将长度为X的每个子字符串哈希到一个unordered_multimap。因此,我逐个字符遍历每个字符串以确定每个哈希。 substr函数创建一个新字符串,并将std :: pair插入到multimap中。我想尽可能避免。有办法解决这个问题吗?
伪代码示例:
For each String str:
For i to str.length - hashlength
hash = str.substr(i, hashlength) //A
unordered_multimap.insert({{hash, i}}); //B
我更希望A和B部分尽可能少地使用构造函数。
答案 0 :(得分:7)
有几个库允许您这样做。例如boost::string_ref
和llvm::StringRef
。类似的类string_view
(boost::string_ref
所基于的)正在为未来的标准化工作。如果您不想下载其他库,则该类实现起来相当简单。它只是一个const char*
表示子字符串的开头,一个整数表示长度(或者另一个指示终点的指针),加上一些效用函数。
所有这些类需要注意的一点是,只要使用引用对象,就需要确保源字符串保持活动且未修改(或者至少确保不会发生重新分配)。换句话说,用与指针相同的谨慎对待它们(因为它基本上就是它们)。