这个问题有点棘手,至少对我而言。我想在文本中获取所有名称。容易,还是? ; - )
让我们从一个简单的代码开始:
for m in re.finditer("(?:Dr\.|med\.|Family)\s*([A-Z][a-z]+(?: [A-Z][a-z]+)?)", my_text):
print '%02d-%02d: %s' % (m.start(), m.end(), m.group(1))
现在,我的名字如下:
74090-74112: Johannes Restnoan ###this should be two seperate names on the new list
87125-87138: Matheus
现在,我想将所有找到的名称放在列表中,并使用my_text检查列表并创建一个新列表,如:
namecheck = set(that_list_i_created).intersection(my_text)
这是某种可能的,或者?如何使用名称创建该列表(Johannes,Restnoan,Matheus)?
是否可以获取最后一个列表中单词的索引?
答案 0 :(得分:0)
我完成了它:
list=[]
和thn:
list.append((m.start(), m.end(), m.group(1)))