使用字符串erase()和字符串长度()从字符串中删除某些字符

时间:2018-03-29 14:14:32

标签: c++ string algorithm for-loop erase

我在下面编写了一个函数来遍历一个字符串,删除所有空格' ''-' s。但是,它正在跳过字符串的一些元素并在末尾留下'-',因此逻辑必须是不正确的。谁能找到我出错的地方?

#include <iostream>
#include <string>
using namespace std;

string FormatString(string S) { 

    size_t original_size = S.length();

    cout << "Length at start is " << S.length() << "\n";

    /*Count spaces and dashes*/
    for(size_t i = 0; i < S.length(); i++) {

        cout << "Current letter is " << S[i] << "\n";

        if((S[i] == ' ') || (S[i] == '-')) {
            cout << "Deleting current letter " << S[i] << "\n";
            S.erase (i,1);
            cout << "Length is now " << S.length() << "\n";

        }
    }

    std::cout << S << '\n';

    return S;
}


int main() {

    std::string testString("AA BB-4499--5");
    std::string result = FormatString(testString);
    cout << result << endl; // prints !!!Hello World!!!
    return 0;
}

输出结果为:

Length at start is 13
Current letter is A
Current letter is A
Current letter is  
Deleting current letter  
Length is now 12
Current letter is B
Current letter is -
Deleting current letter -
Length is now 11
Current letter is 4
Current letter is 9
Current letter is 9
Current letter is -
Deleting current letter -
Length is now 10
Current letter is 5
AABB4499-5
AABB4499-5

2 个答案:

答案 0 :(得分:1)

该功能的问题在于,当一个字符被删除时,索引会递增。所以一些相邻的字符仍然在字符串中。

最好使用基于标准算法std::removestd::remove_if的所谓成语erase-remove。

这是一个示范程序

#include <iostream>
#include <string>
#include <algorithm>
#include <cstring>

std::string FormatString( const std::string &s, const std::string &erased = " -" )
{
    const char *data = erased.data();

    std::string t( s );

    t.erase( std::remove_if( t.begin(), t.end(), [=]( char c ) { return std::strchr( data, c ); } ), 
             t.end() );

    return t;
}

int main() 
{
    std::string testString( "AA BB-4499--5" );

    std::cout << FormatString( testString ) << std::endl;

    return 0;
}

它的输出是

AABB44995

答案 1 :(得分:1)

这是因为您在擦除后递增位置。

当您进行擦除时,将所有其他字符向下移动一个。如果您随后也增加了字符串中的位置,则实际上会跳过一个字符。

如果我们从这开始:

"AA BB-4499--5"

删除几个字后,我们留下了这个

"AABB4499--5"
         ^           // i is 9.

现在删除光标上方的字符。

"AABB4499-5"
         ^           // i is 9.

现在开始循环的下一次迭代。

"AABB4499-5"
          ^          // i is 10.

你注意到你跳过了一个角色。

此算法的更好实现是:

for(size_t i = 0; i < S.length();) {     // Notice no increment here
    if((S[i] == ' ') || (S[i] == '-')) {
        S.erase (i,1);
    }
    else {
        ++i;
    }
}

我们可以使用迭代器来改进:

for(auto loop = std::begin(S); loop != std::end(S);) {
    if (*loop == ' ' || *loop == '-') {
        loop = S.erase(loop);
    }
    else {
        ++loop;
    }
}

现在我们正在使用迭代器,我们可以循环标准算法

auto newEnd = std::remove_if(std::begin(S), std::end(S),
                             [](char c){return c == ' ' || c == '-';});
std::erase(newEnd, std::end(S));