我有一个这样的清单:
['t__f326ea56',
'foo\tbar\tquax',
'some\ts\tstring']
我希望得到4个不同变量的结果:
s1 = 't__f326ea56'
s2 = ['foo', 'some']
s3 = ['bar', 's']
s4 = ['quax', 'string']
通常我可以像re.search(r'(.*)\t(.*)\t(.*)', lst).group(i)
那样进行搜索,以获得s2,s3,s4。但我无法同时搜索所有4.我可以使用re模块中的任何特殊选项吗?
由于
答案 0 :(得分:1)
您可以使用split()
模块中的re
方法:
import re
s = ['t__f326ea56',
'foo\tbar\tquax',
'some\ts\tstring']
new_data = [re.split("\\t", i) for i in s]
s1 = new_data[0][0]
s2, s3, s4 = map(list, zip(*new_data[1:]))
输出:
s1 = 't__f326ea56'
s2 = ['foo', 'some']
s3 = ['bar', 's']
s4 = ['quax', 'string']
编辑:
列表清单:
s = [['t__f326ea56', 'foo\tbar\tquax', 'some\ts\tstring'], ['second\tbar\tfoo', 'third\tpractice\tbar']]
new_s = [[re.split("\\t", b) for b in i] for i in s]
new_s
现在存储:
[[['t__f326ea56'], ['foo', 'bar', 'quax'], ['some', 's', 'string']], [['second', 'bar', 'foo'], ['third', 'practice', 'bar']]]
转置new_s
中的数据:
new_s = [[b for b in i if len(b) > 1] for i in new_s]
final_s = list(map(lambda x: zip(*x), new_s))
final_s
现在将以您希望的原始方式存储数据:
[[('foo', 'some'), ('bar', 's'), ('quax', 'string')], [('second', 'third'), ('bar', 'practice'), ('foo', 'bar')]]
答案 1 :(得分:0)
使用“直”str.split()
函数:
l = ['t__f326ea56', 'foo\tbar\tquax', 'some\ts\tstring']
items1, items2 = l[1].split('\t'), l[2].split('\t')
s1, s2, s3, s4 = l[0], [items1[0], items2[0]], [items1[1], items2[1]], [items1[2], items2[2]]
print(s1, s2, s3, s4)
输出:
t__f326ea56 ['foo', 'some'] ['bar', 's'] ['quax', 'string']