def get_title(name):
title_search = re.search(' ([A-Za-z]+)\.', name)
# If the title exists, extract and return it.
if title_search:
return title_search.group(1)
return ""
title_search = re.search(' ([A-Za-z]+)\.', name)
是什么意思?
答案 0 :(得分:0)
泰坦尼克号数据集的乘客姓名,例如:Graham, Miss. Margaret Edith
和Behr, Mr. Karl Howell
此处的标题为Mr.
和Miss.
title_search = re.search(' ([A-Za-z]+).', name)
上面的代码行搜索具有标题的名称。 先生和 不是唯一的人,例如, 博士,教授 等等。由于我们事先不知道标题是什么,但我们知道模式,即“字母加句号” ,因此我们仅查找这些单词。
([A-Za-z]+).
的意思是,寻找以A-Z或a-z开头并以句号结尾的任何单词。
我建议您阅读正则表达式。