拆分std :: string并插入std :: set

时间:2012-06-21 20:40:18

标签: c++

根据C ++聊天室的精彩人物的要求,有什么方法可以分解文件(在我的情况下包含大约100行的字符串,每行大约10个单词)并插入所有这些单词都变成了std :: set?

3 个答案:

答案 0 :(得分:24)

从包含一系列元素的源构造任何容器的最简单方法是使用带有一对迭代器的构造函数。使用istream_iterator迭代流。

#include <set>
#include <iostream>
#include <string>
#include <algorithm>
#include <iterator>

using namespace std;

int main()
{
  //I create an iterator that retrieves `string` objects from `cin`
  auto begin = istream_iterator<string>(cin);
  //I create an iterator that represents the end of a stream
  auto end = istream_iterator<string>();
  //and iterate over the file, and copy those elements into my `set`
  set<string> myset(begin, end);

  //this line copies the elements in the set to `cout`
  //I have this to verify that I did it all right
  copy(myset.begin(), myset.end(), ostream_iterator<string>(cout, "\n"));
  return 0;
}

http://ideone.com/iz1q0

答案 1 :(得分:3)

假设您已将文件读入字符串,boost :: split将起到作用:

#include <set>
#include <boost/foreach.hpp>
#include <boost/algorithm/string.hpp>

std::string astring = "abc 123 abc 123\ndef 456 def 456";  // your string
std::set<std::string> tokens;                              // this will receive the words
boost::split(tokens, astring, boost::is_any_of("\n "));    // split on space & newline

// Print the individual words
BOOST_FOREACH(std::string token, tokens){
    std::cout << "\n" << token << std::endl;
}

如果需要,可以使用列表或向量代替集合。

另请注意,这几乎是一个骗局: Split a string in C++?

答案 2 :(得分:1)

#include <set>
#include <iostream>
#include <string>

int main()
{
  std::string temp, mystring;
  std::set<std::string> myset;

  while(std::getline(std::cin, temp))
      mystring += temp + ' ';
  temp = "";      

  for (size_t i = 0; i < mystring.length(); i++)
  {
    if (mystring.at(i) == ' ' || mystring.at(i) == '\n' || mystring.at(i) == '\t')
    {
      myset.insert(temp);
      temp = "";
    }
    else
    {
      temp.push_back(mystring.at(i));
    }
  }
  if (temp != " " || temp != "\n" || temp != "\t")
    myset.insert(temp);

  for (std::set<std::string>::iterator i = myset.begin(); i != myset.end(); i++)
  {
    std::cout << *i << std::endl;
  }
  return 0;
}

让我们从顶部开始吧。首先,您需要使用一些变量。当您从要解析的字符串中的每个字符构建字符串时,temp只是字符串的占位符。 mystring是您要拆分的字符串,而myset是您将要分割字符串的位置。

然后我们读取文件(通过<输入)并将内容插入mystring

现在我们要迭代字符串的长度,搜索空格,换行符或制表符以分割字符串。如果我们找到其中一个字符,那么我们需要insert字符串进入集合,并清空我们的占位符字符串,否则,我们将字符添加到占位符,这将构建字符串。完成后,我们需要将最后一个字符串添加到集合中。

最后,我们遍历集合,并打印每个字符串,这只是用于验证,但在其他情况下可能会有用。

修改:我Loki Astaricomment中提供的代码的重大改进,我认为应该将其整合到答案中:

#include <set>
#include <iostream>
#include <string>

int main()
{
  std::set<std::string> myset;
  std::string word;

  while(std::cin >> word)
  {
      myset.insert(std::move(word));
  }

  for(std::set<std::string>::const_iterator it=myset.begin(); it!=myset.end(); ++it)
    std::cout << *it << '\n';
}