我有一个非常大的std::vector
类型的v
std::vector<std::string> v
。现在,我要比较向量中哪些元素以某个子字符串开头 str
。最快的方法是什么?
我想到了一个for循环,该循环将v
的每个元素的开始与子字符串str
进行比较。我第一次尝试过
std::string substring = "bla";
for (long unsigned int i = 0; i < v.size(); i++)
{
if (!strncmp(v[i].c_str(), substring.c_str(), substring.size()))
{
std::cout << "Item found: " << v[i] << std::endl;
}
}
有什么更好的选择?
答案 0 :(得分:4)
您可以完全编写c++代码。
如果要查找满足条件的所有元素,则不可避免地要遍历整个向量。
但是您可以使用更好的 range-based for-loop
而不是基于索引的循环来遍历向量,然后检查str.find(substring) == 0
(归功于 @PiotrSkotnicki )。
这是示例代码: (See online)
#include <iostream>
#include <string>
#include <vector>
int main()
{
const std::string substring{ "bla" };
std::vector<std::string> vecString{ {"bllll"}, {"bllll"}, {"blasomething"} };
// iterate through the vector by range based for-loop
// here `auto` deduded to `std::string` as you have vector of strings(i.e. `vecString`)
for (const auto& str : vecString)
{
if (str.find(substring) == 0) {
std::cout << str << " is a match\n";
// do something more with str
}
}
return 0;
}
或者使用std::for_each
以及lambda函数,您可以编写以下内容。在此处详细了解有关lambda的信息:What is a lambda expression in C++11?
(See online)
#include <algorithm> // std::for_each
std::for_each(std::cbegin(vecString), std::cend(vecString), [&substring](const auto& str)
{
if (str.find(substring) == 0)
{
std::cout << str << " is a match\n";
// do something more with str
}
});
如果您只对字符串向量中的第一个匹配感兴趣,请使用标准算法std::find_if
,如下所示
#include <algorithm> // std::find_if
const auto iter = std::find_if(std::cbegin(vecString), std::cend(vecString),
[&substring](const auto& str) {
return str.find(substring) == 0;
}
);
if (iter != std::cend(vecString))
{
// do something
}
答案 1 :(得分:3)
您可以使用c ++ 20 std::string_view::start_with
:
std::vector<std::string> v = {...};
std::string_view prefix = "bla";
for (std::string_view sv : v)
if (sv.starts_with(prefix))
std::cout << "Item found: " << sv << std::endl;
答案 2 :(得分:2)
如果您有未排序的容器,那么在时间复杂度上不会比 O(n)好,这意味着以线性方式遍历整个容器(即for循环)。如果您对容器进行了排序(例如plac
而不是std::set
),则会得到更好的 O(log n)(二进制搜索)。
在C ++ 17之前,我无法提供比您更好的解决方案(因为通过std::vector
创建子字符串意味着不必要地复制子字符串)。但是C ++ 17引入了std::string::substr
,它不会进行任何复制。启用编译器优化应该不会有明显的性能差异。
std::string_view
下面是std::vector<std::string> v { "abcd", "abcdefg", "aaaabbbb", "abc", "ab"};
std::string_view query = "abc";
for (auto const& str : v)
{
if (str.size() < query.size())
continue;
auto probe = std::string_view(str).substr(0, query.size());
if (query == probe)
std::cout << "Item found: " << str << "\n";
}
版本,可以更快地进行搜索:
std::set