替换字符串中的多个字符

时间:2013-11-27 21:14:33

标签: python regex str-replace

我有一个csv文件,如下所示:

Mon-000101,100.27242,9.608597,11.082,10.034,0.39,I,0.39,I,31.1,31.1,,double with 1355,,,,,,,,
Mon-000171,100.2923,9.52286,14.834,14.385,0.45,I,0.45,I,33.7,33.7,,,,,,,,,,
Mon-000174,100.27621,9.563802,11.605,10.134,0.95,I,1.29,I,30.8,30.8,,,,,,,,,,

......这是几百行。

我只想抓住Mon-000101(不只是那个特定的,而是所有的Mon - ######)项目。我把这个非常丑陋的小脚本放在了一起:

file_list1 = open(raw_input("Enter your list file: "))
file_lines = []
for line in file_list1:
    line.replace(' ','\n')
    for item in line.split('\n'):
        file_lines.append(item)
stringit = ''
for item in file_lines:
    stringit += item

IDs = re.findall('Mon-\d\d\d\d\d\d',stringit)
stringIDs = str(IDs)
new = stringIDs.replace(',','\n')

newer = new.replace('\'','')
newer2 = newer.replace('[\]','')
newer3 = newer2.replace(']','')
newer4 = newer3.replace('[','')
newer5 = newer4.replace(' ','')
file_write = open("Testit.txt","w+")
file_write.write(newer4)
print newer4
file_write.close()

我知道这很难看。显然我不知道我正在做什么与正则表达式的东西,但除此之外,我想知道一个更有效的方法来替换我正在取代的所有字符。我知道这不是它的完成方式。

我尝试了一些东西
newer2 = newer.replace('([\',\[\] ])','') 

我从各种帖子拼凑而成。但这并没有奏效,事实上它没有做任何事情。

我希望看到一种更有效的方法。

感谢。

我也知道我的变量命名不够/不符合样式指南。这只是我很快就聚集在一起的东西。

2 个答案:

答案 0 :(得分:3)

假设ID始终是行的第一部分,这是一种简单的方法:

import csv
with open('some_list_file.txt', 'rb') as list_file:
    reader = csv.reader(some_list_file)
    with open('Testit.txt', 'W+') as output_file:
        output_file.writelines(line[0] + '\n' for line in reader)

如果职位变化,那就会变得更复杂一些:

import csv
with open('some_list_file.txt', 'rb') as list_file:
    reader = csv.reader(some_list_file)
    with open('Testit.txt', 'W+') as output_file:
        for line in reader:
            IDs = [part for part in line if part.startswith('Mon-')]
            if IDs:
                output_file.write(IDs[0] + '\n') # or accept multiple ID values if that's a possibilty

如果你确定每一行都有一个Mon-条目,你可以缩短一点:

    with open('Testit.txt', 'W+') as output_file:
        output_file.writelines([part for part in line if part.startswith('Mon-')][0] + '\n' for line in reader])

答案 1 :(得分:1)

将正则表达式^Mon\-\d{6}m修饰符一起使用。