用整数替换字符串中重复的单词

时间:2009-06-04 02:53:02

标签: c++ algorithm text-processing

我在使用C ++进行字符串操作时遇到问题。

规则:如果从句子或段落重复相同的'单词',我希望它成为一个整数。

示例:

  • 输入:we prefer questions that can be answered, not just we discussed that.
  • 输出:1 prefer questions 2 can be answered, not just 1 discussed 2.
1 we
2 that

3 个答案:

答案 0 :(得分:4)

如果使用关联数组来跟踪已经看过的单词,这种类型的问题通常会更容易解决。尝试使用STL map存储您已经看过的单词。正确设置逻辑需要一些工作,但地图肯定有助于你想要做的事情。

答案 1 :(得分:4)

这是我将采用的方法(仅限算法,因为它是家庭作业)。

  1. 创建将单词映射到计数的数据结构。
  2. 一次处理一个单词。
    • 如果是新单词,请将其添加到数据结构并将其计数设置为1.
    • 如果它是现有的,只需递增计数。
  3. 处理完所有单词后,请遍历数据结构中的每个单词,为计数大于1的单词提供唯一的整数。
  4. 创建一个新的文本字符串,空为开始,然后再次逐字处理文本。
    • 如果单词的计数为1,则将该单词附加到新字符串。
    • 如果计数大于1,则附加唯一整数。

答案 2 :(得分:1)

  

解析:

   For each word in the string
          Check whether the word exists in map<WORD,Counter>
          if the WORD is new the insert into the map with counter =0
          otherwise increment the counter associated with word.
  

输出:(创建新句子)

For each word in the string
      Lookup into the vector for counter value
      if counter ==0 then insert WORD as it is
      otherwise convert the counter to string and insert