我有一个清单
list=["John","Tanner",'Mary','Anna',"Oscar",'ID']
和一个文本文件。文本文件中的内容如下所示:
ID 'blablablabla...'
V1 'John' 'blablablabla...'
V2 'Anna' 'blablablabla...'
V3 'Josh' 'blablablabla...'
V4 'Mary' 'blablablabla...'
V5 'Steven' 'blablablabla...'
我想搜索文本文件中的列表,最后我希望得到的结果为:
RESULT=[1,'NA',4,2,'NA',0].
1,4和2是从V1,V4和V2中提取的数字。这是代码:
start_time = time.time()
for item in list:
with open('C:/Mary/test.txt', 'r') as file:
for line in file:
if item in line:
var_name=line.split()[0]
if var_name=='ID':
var_loc.append(0)
else:
var_loc.append(int(re.split('(\d+)',var_name)[1]))
break
#else:
# var_loc.append('NA')
total_time = time.time() - start_time
total_time
问题:当我从列表中选择一个项目并在文本内部搜索时,如果该项目在文本中不存在,我希望它返回“ NA”。但是我无法弄清楚它是否正确。正如我说的,我希望结果最后看起来像这样:
RESULT=[1,'NA',4,2,'NA',0].
谢谢。
答案 0 :(得分:3)
您可以使用正则表达式来做到这一点:
with open('C:/Mary/test.txt', 'r') as f:
s = f.read()
for item in items:
if item == 'ID':
var_loc.append(0)
continue
m = re.search(f"^V(\d+) '{item}'", s, flags=re.MULTILINE)
if m is None:
var_loc.append('NA')
else:
var_loc.append(m.group(1))
请不要使用list
关键字作为变量名-这是python list
函数的关键字(我将其替换为items
)。