迭代时从STL集中删除元素

时间:2010-05-20 14:03:54

标签: c++ stl iterator set

我需要浏览一组并删除符合预定义条件的元素。

这是我写的测试代码:

#include <set>
#include <algorithm>

void printElement(int value) {
    std::cout << value << " ";
}

int main() {
    int initNum[] = { 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 };
    std::set<int> numbers(initNum, initNum + 10);
    // print '0 1 2 3 4 5 6 7 8 9'
    std::for_each(numbers.begin(), numbers.end(), printElement);

    std::set<int>::iterator it = numbers.begin();

    // iterate through the set and erase all even numbers
    for (; it != numbers.end(); ++it) {
        int n = *it;
        if (n % 2 == 0) {
            // wouldn't invalidate the iterator?
            numbers.erase(it);
        }
    }

    // print '1 3 5 7 9'
    std::for_each(numbers.begin(), numbers.end(), printElement);

    return 0;
}

首先,我认为在迭代它时从集合中擦除一个元素会使迭代器失效,并且for循环的增量将具有未定义的行为。尽管如此,我执行了这个测试代码并且一切顺利,我无法解释原因。

我的问题: 这是std集的已定义行为还是特定于此实现?顺便说一句,我在ubuntu 10.04(32位版本)上使用gcc 4.3.3。

谢谢!

建议的解决方案:

这是从集合中迭代和擦除元素的正确方法吗?

while(it != numbers.end()) {
    int n = *it;
    if (n % 2 == 0) {
        // post-increment operator returns a copy, then increment
        numbers.erase(it++);
    } else {
        // pre-increment operator increments, then return
        ++it;
    }
}

编辑:首选解决方案

我找到了一个对我来说更优雅的解决方案,即使它完全相同。

while(it != numbers.end()) {
    // copy the current iterator then increment it
    std::set<int>::iterator current = it++;
    int n = *current;
    if (n % 2 == 0) {
        // don't invalidate iterator it, because it is already
        // pointing to the next element
        numbers.erase(current);
    }
}

如果while内有多个测试条件,则每个测试条件都必须递增迭代器。我更喜欢这段代码,因为迭代器只在一个地方增加 ,使得代码不易出错且更易读。

8 个答案:

答案 0 :(得分:156)

这取决于实现:

标准23.1.2.8:

  

插入成员不应影响迭代器的有效性和对容器的引用,并且擦除成员应仅使迭代器和对已擦除元素的引用无效。

也许你可以试试这个 - 这是符合标准的:

for (it = numbers.begin(); it != numbers.end(); ) {
    if (*it % 2 == 0) {
        numbers.erase(it++);
    }
    else {
        ++it;
    }
}

请注意,它是后缀,因此它将旧位置传递给擦除,但由于操作符的原因,它首先跳转到较新的位置。

2015.10.27更新: C ++ 11解决了这个缺陷。 iterator erase (const_iterator position);将一个迭代器返回到删除最后一个元素后面的元素(如果删除了最后一个元素,则返回set :: end)。所以C ++ 11风格是:

for (it = numbers.begin(); it != numbers.end(); ) {
    if (*it % 2 == 0) {
        it = numbers.erase(it);
    }
    else {
        ++it;
    }
}

答案 1 :(得分:18)

如果你通过valgrind运行你的程序,你会看到一堆读错误。换句话说,是的,迭代器正在失效,但你在你的例子中变得幸运(或者真的很不幸,因为你没有看到未定义行为的负面影响)。对此的一个解决方案是创建临时迭代器,增加临时值,删除目标迭代器,然后将目标设置为temp。例如,按如下方式重写循环:

std::set<int>::iterator it = numbers.begin();                               
std::set<int>::iterator tmp;                                                

// iterate through the set and erase all even numbers                       
for ( ; it != numbers.end(); )                                              
{                                                                           
    int n = *it;                                                            
    if (n % 2 == 0)                                                         
    {                                                                       
        tmp = it;                                                           
        ++tmp;                                                              
        numbers.erase(it);                                                  
        it = tmp;                                                           
    }                                                                       
    else                                                                    
    {                                                                       
        ++it;                                                               
    }                                                                       
} 

答案 2 :(得分:7)

你误解了“未定义的行为”的含义。未定义的行为并不意味着“如果您这样做,您的程序崩溃或产生意外结果。”这意味着“如果你这样做,你的程序可能会崩溃或产生意想不到的结果”,或者做任何其他事情,具体取决于你的编译器,你的操作系统,月亮的阶段等等。

如果某些内容在没有崩溃的情况下执行并且按预期运行,则证明它不是未定义的行为。所有证明的是,在特定操作系统上使用特定编译器进行编译后,其行为恰好与特定运行一样。

从集合中删除元素会使迭代器无效,从而使删除的元素无效。使用无效的迭代器是未定义的行为。事实恰恰相反,观察到的行为就是你在这个特定情况下的意图;这并不意味着代码是正确的。

答案 3 :(得分:2)

请注意,如果是deque容器,检查deque迭代器与numbers.end()相等的所有解决方案都可能在gcc 4.8.4上失败。也就是说,擦除deque的元素通常会使指向numbers.end():

的指针无效
#include <iostream>
#include <deque>

using namespace std;
int main() 
{

  deque<int> numbers;

  numbers.push_back(0);
  numbers.push_back(1);
  numbers.push_back(2);
  numbers.push_back(3);
  //numbers.push_back(4);

  deque<int>::iterator  it_end = numbers.end();

  for (deque<int>::iterator it = numbers.begin(); it != numbers.end(); ) {
    if (*it % 2 == 0) {
      cout << "Erasing element: " << *it << "\n";
      numbers.erase(it++);
      if (it_end == numbers.end()) {
    cout << "it_end is still pointing to numbers.end()\n";
      } else {
    cout << "it_end is not anymore pointing to numbers.end()\n";
      }
    }
    else {
      cout << "Skipping element: " << *it << "\n";
      ++it;
    }
  }
}

输出:

Erasing element: 0
it_end is still pointing to numbers.end()
Skipping element: 1
Erasing element: 2
it_end is not anymore pointing to numbers.end()

请注意,虽然在此特定情况下deque转换是正确的,但结束指针在此过程中已失效。对于不同大小的双端队列,错误更明显:

int main() 
{

  deque<int> numbers;

  numbers.push_back(0);
  numbers.push_back(1);
  numbers.push_back(2);
  numbers.push_back(3);
  numbers.push_back(4);

  deque<int>::iterator  it_end = numbers.end();

  for (deque<int>::iterator it = numbers.begin(); it != numbers.end(); ) {
    if (*it % 2 == 0) {
      cout << "Erasing element: " << *it << "\n";
      numbers.erase(it++);
      if (it_end == numbers.end()) {
    cout << "it_end is still pointing to numbers.end()\n";
      } else {
    cout << "it_end is not anymore pointing to numbers.end()\n";
      }
    }
    else {
      cout << "Skipping element: " << *it << "\n";
      ++it;
    }
  }
}

输出:

Erasing element: 0
it_end is still pointing to numbers.end()
Skipping element: 1
Erasing element: 2
it_end is still pointing to numbers.end()
Skipping element: 3
Erasing element: 4
it_end is not anymore pointing to numbers.end()
Erasing element: 0
it_end is not anymore pointing to numbers.end()
Erasing element: 0
it_end is not anymore pointing to numbers.end()
...
Segmentation fault (core dumped)

以下是解决此问题的方法之一:

#include <iostream>
#include <deque>

using namespace std;
int main() 
{

  deque<int> numbers;
  bool done_iterating = false;

  numbers.push_back(0);
  numbers.push_back(1);
  numbers.push_back(2);
  numbers.push_back(3);
  numbers.push_back(4);

  if (!numbers.empty()) {
    deque<int>::iterator it = numbers.begin();
    while (!done_iterating) {
      if (it + 1 == numbers.end()) {
    done_iterating = true;
      } 
      if (*it % 2 == 0) {
    cout << "Erasing element: " << *it << "\n";
      numbers.erase(it++);
      }
      else {
    cout << "Skipping element: " << *it << "\n";
    ++it;
      }
    }
  }
}

答案 4 :(得分:1)

此行为是特定于实现的。为了保证迭代器的正确性,你应该使用“it = numbers.erase(it);”声明,如果你需要删除元素,只是在其他情况下简单地使用迭代器。

答案 5 :(得分:1)

我认为在尝试删除由迭代器包装的对象时,使用STL方法'remove_if'可以帮助防止某些奇怪的问题。

此解决方案的效率可能较低。

假设我们有某种容器,例如vector或称为m_bullets的列表:

Bullet::Ptr is a shared_pr<Bullet>

'it'是'remove_if'返回的迭代器,第三个参数是在容器的每个元素上执行的lambda函数。由于容器包含Bullet::Ptr,因此lambda函数需要获取作为参数传递的该类型(或对该类型的引用)。

 auto it = std::remove_if(m_bullets.begin(), m_bullets.end(), [](Bullet::Ptr bullet){
    // dead bullets need to be removed from the container
    if (!bullet->isAlive()) {
        // lambda function returns true, thus this element is 'removed'
        return true;
    }
    else{
        // in the other case, that the bullet is still alive and we can do
        // stuff with it, like rendering and what not.
        bullet->render(); // while checking, we do render work at the same time
        // then we could either do another check or directly say that we don't
        // want the bullet to be removed.
        return false;
    }
});
// The interesting part is, that all of those objects were not really
// completely removed, as the space of the deleted objects does still 
// exist and needs to be removed if you do not want to manually fill it later 
// on with any other objects.
// erase dead bullets
m_bullets.erase(it, m_bullets.end());

'remove_if'删除lambda函数返回true的容器,并将该内容移动到容器的开头。 “ it”指向一个未定义的对象,可以将其视为垃圾。从'it'到m_bullets.end()的对象可以删除,因为它们占用内存但包含垃圾,因此在该范围上调用'erase'方法。

答案 6 :(得分:0)

我遇到了同样的旧问题,并在下面的代码中发现了更多的可理解的,这是上述解决方案中的一种方式。

std::set<int*>::iterator beginIt = listOfInts.begin();
while(beginIt != listOfInts.end())
{
    // Use your member
    std::cout<<(*beginIt)<<std::endl;

    // delete the object
    delete (*beginIt);

    // erase item from vector
    listOfInts.erase(beginIt );

    // re-calculate the begin
    beginIt = listOfInts.begin();
}

答案 7 :(得分:0)

C ++ 20将具有“统一容器擦除”功能,您将能够编写:

std::erase_if(numbers, [](int n){ return n % 2 == 0 });

这将适用于vectorsetdeque等。 有关更多信息,请参见cppReference