如何在C ++中将空格分隔的字符串拆分为多个字符串?

时间:2011-12-30 19:36:40

标签: c++ string stream

我的代码有点如下:

static int myfunc(const string& stringInput)
{
    string word;
    stringstream ss;

    ss << stringInput;
    while(ss >> word)
    {
        ++counters[word];
    }
    ...
}

这里的目的是将输入字符串(由空格''分隔)到字符串变量word中,但这里的代码似乎有很多开销 - 将输入字符串转换为字符串流并从字符串流中读取到目标字符串中。

是否有更优雅的方法来达到同样的目的?

5 个答案:

答案 0 :(得分:5)

您正在询问如何拆分字符串。 Boost有一个有用的实用程序boost :: split()

http://www.boost.org/doc/libs/1_48_0/doc/html/string_algo/usage.html#id3115768

这是一个将结果单词放入向量的示例:

#include <boost/algorithm/string.hpp>
std::vector<std::string> strs;
boost::split(strs, "string to split", boost::is_any_of("\t "));

答案 1 :(得分:3)

Code in c++
#include<sstream>
#include<vector>
using namespace std;    
string diskNames="vbbc anmnsa mansdmns";
string temp;
vector <string> cds;
stringstream s (diskNames);
while(s>> temp)
cds.push_back(temp);

答案 2 :(得分:1)

使用流迭代器和标准函数:

static int myfunc(std::string const& stringInput)
{
    std::stringstream ss(stringInput);

    std::for_each(std::istream_iterator<std::string>(ss),
                  std::istream_iterator<std::string>(),
                  [&counters](std::string const& word) { ++counters[word];}
                 )
    ...
}

如果你没有lambda那么:

struct Helper
{
     void operator()(std::string const& word) const {++counters[word];}
     Helper(CounterType& c) : counters(c) {}
     CounterType& counters;
};

static int myfunc(std::string const& stringInput)
{
    std::stringstream ss(stringInput);

    std::for_each(std::istream_iterator<std::string>(ss),
                  std::istream_iterator<std::string>(),
                  Helper(counters)
                 )
    ...
}

答案 3 :(得分:0)

使用ostringstream,也许

istringstream(stringInput); // initialize with the string

答案 4 :(得分:0)

在Visual C ++ 11中,您可以使用TR1中的regex_token_iterator。

sregex_token_iterator::regex_type white_space_separators("[[:space:]]+",regex_constants::optimize);

for(sregex_token_iterator i(s.begin(),s.()end,white_space_separators,-1),end; i!=end; i++)
{
 cout << *i << endl;
 // or use i.start, i.end which is faster access
}

如果您担心性能(以及字符串复制等开销),您可以编写自己的例程:

#include <ctype.h>

#include <string>
#include <iostream>
using namespace std;

int main()
{
 string s = "Text for tokenization  ";

 const char *start = s.c_str();
 const char *end = start + s.size();
 const char *token = start;

 while (start!=end)
 {
   if(isspace(*start))
   {
    if (token < start)
    {
      // Instead of constructing string, you can 
      // just use [token,start] part of the input buffer
      cout << string(token,start) << ' ';
    }

    start++;
    token = start;
   }
   else
   {
    start++;
   }
 } 

 if (token < start)
 {
    cout << string(token,start) << ' ';
 }

}