Python - 如何仅在字符串中连续删除重复项?

时间:2012-07-12 21:19:46

标签: python python-2.7

对于'12233322155552'等字符串,删除重复项后,我可以'1235'

但我要保留的是'1232152'只删除连续的重复项。

9 个答案:

答案 0 :(得分:10)

微软/亚马逊求职面试问题类型: 这是伪代码,实际代码留作练习。

for each char in the string do:
   if the current char is equal to the next char:
      delete next char
   else
     continue

return string

作为更高级别,尝试(实际上不是实现):

for s in string:
  if s == s+1:  ## check until the end of the string
     delete s+1

答案 1 :(得分:9)

import re
answer = re.sub(r'(\d)\1+', r'\1', '12233322155552')

答案 2 :(得分:8)

您可以使用itertools,这是一个班轮

>>> s = '12233322155552'
>>> ''.join(i for i, _ in itertools.groupby(s))
'1232152'

答案 3 :(得分:7)

提示:itertools模块非常有用。特别是itertools.groupby的一个功能可能非常方便:

  

itertools.groupby(iterable [,key])

     

创建一个从中返回连续键和组的迭代器   可迭代的。关键是计算每个键值的函数   元件。如果未指定或为None,则键默认为标识   function并返回元素不变。一般来说,可迭代   需要已经在相同的键功能上排序。

因为字符串是可迭代的,你可以做的是:

use groupby to collect neighbouring elements
extract the keys from the iterator returned by groupby
join the keys together

这一切都可以在一条简洁的线上完成..

答案 4 :(得分:2)

首先,你无法从Python中的字符串中删除任何内容(google“Python immutable string”,如果不清楚的话)。

M第一种方法是:

foo = '12233322155552'
bar = ''
for chr in foo:
    if bar == '' or chr != bar[len(bar)-1]:
        bar += chr

或者,使用上面的itertools提示:

''.join([ k[0] for k in groupby(a) ])

答案 5 :(得分:1)

+1 for groupby。脱下袖口,像是:

from itertools import groupby
def remove_dupes(arg):
    # create generator of distinct characters, ignore grouper objects
    unique = (i[0] for i in groupby(arg))
    return ''.join(unique)

在Python 2.7.2中为我做饭

答案 6 :(得分:1)

number = '12233322155552'
temp_list = []


for item in number:   
   if len(temp_list) == 0:
      temp_list.append(item)

   elif len(temp_list) > 0:
      if  temp_list[-1] != item:
          temp_list.append(item)

print(''.join(temp_list))

答案 7 :(得分:1)

这将是一种方式:

def fix(a):
    list = []

    for element in a:
        # fill the list if the list is empty
        if len(list) == 0:list.append(element)
        # check with the last element of the list
        if list[-1] != element:  list.append(element)

    print(''.join(list))    


a= 'GGGGiiiiniiiGinnaaaaaProtijayi'
fix(a)
# output => GiniGinaProtijayi

答案 8 :(得分:0)

t = '12233322155552'
for i in t:
    dup = i+i
    t = re.sub(dup, i, t)

您可以将最终输出设为1232152