如何检查std :: vector <std :: string>的元素是否以某些子字符串开头?

时间:2019-08-24 17:00:20

标签: c++ c++11 stdvector stdstring c++-standard-library

我有一个非常大的std::vector类型的v std::vector<std::string> v。现在,我要比较向量中哪些元素以某个子字符串开头 str。最快的方法是什么?

我想到了一个for循环,该循环将v的每个元素的开始与子字符串str进行比较。我第一次尝试过

std::string substring = "bla";
for (long unsigned int i = 0; i < v.size(); i++)
{
    if (!strncmp(v[i].c_str(), substring.c_str(), substring.size())) 
    {
        std::cout << "Item found: " << v[i] << std::endl;
    }
}

混在一起,对此我感到不满意。

有什么更好的选择?

3 个答案:

答案 0 :(得分:4)

您可以完全编写代码。

如果要查找满足条件的所有元素,则不可避免地要遍历整个向量。 但是您可以使用更好的 range-based for-loop 而不是基于索引的循环来遍历向量,然后检查str.find(substring) == 0(归功于 @PiotrSkotnicki )。

这是示例代码:  See online

#include <iostream>
#include <string>
#include <vector>

int main()
{
    const std::string substring{ "bla" };
    std::vector<std::string> vecString{ {"bllll"}, {"bllll"}, {"blasomething"} };
    // iterate through the vector by range based for-loop
    // here `auto` deduded to `std::string` as you have vector of strings(i.e. `vecString`)
    for (const auto& str : vecString)
    {
        if (str.find(substring) == 0) {
            std::cout << str << " is a match\n";
            // do something more with str
        }
    }
    return 0;
}

或者使用std::for_each以及lambda函数,您可以编写以下内容。在此处详细了解有关lambda的信息:What is a lambda expression in C++11?  See online

#include <algorithm> // std::for_each

std::for_each(std::cbegin(vecString), std::cend(vecString), [&substring](const auto& str)
{
    if (str.find(substring) == 0)
    {
        std::cout << str << " is a match\n";
        // do something more with str
    }
});

如果您只对字符串向量中的第一个匹配感兴趣,请使用标准算法std::find_if,如下所示

#include <algorithm> // std::find_if

const auto iter = std::find_if(std::cbegin(vecString), std::cend(vecString),
    [&substring](const auto& str) {
        return str.find(substring) == 0;
    }
);
if (iter != std::cend(vecString))
{
    // do something
}

答案 1 :(得分:3)

您可以使用c ++ 20 std::string_view::start_with

std::vector<std::string> v = {...};
std::string_view prefix = "bla";
for (std::string_view sv : v)
    if (sv.starts_with(prefix))
        std::cout << "Item found: " << sv << std::endl;

答案 2 :(得分:2)

如果您有未排序的容器,那么在时间复杂度上不会比 O(n)好,这意味着以线性方式遍历整个容器(即for循环)。如果您对容器进行了排序(例如plac而不是std::set),则会得到更好的 O(log n)(二进制搜索)。

在C ++ 17之前,我无法提供比您更好的解决方案(因为通过std::vector创建子字符串意味着不必要地复制子字符串)。但是C ++ 17引入了std::string::substr,它不会进行任何复制。启用编译器优化应该不会有明显的性能差异。

std::string_view

Live example

下面是std::vector<std::string> v { "abcd", "abcdefg", "aaaabbbb", "abc", "ab"}; std::string_view query = "abc"; for (auto const& str : v) { if (str.size() < query.size()) continue; auto probe = std::string_view(str).substr(0, query.size()); if (query == probe) std::cout << "Item found: " << str << "\n"; } 版本,可以更快地进行搜索:

std::set

Live example