泰坦尼克号:从灾难中学习机器

时间:2018-07-27 14:07:48

标签: machine-learning

定义功能以从乘客姓名中提取标题

def get_title(name):
    title_search = re.search(' ([A-Za-z]+)\.', name)
    # If the title exists, extract and return it.
    if title_search:
        return title_search.group(1)
    return ""

title_search = re.search(' ([A-Za-z]+)\.', name)是什么意思?

1 个答案:

答案 0 :(得分:0)

泰坦尼克号数据集的乘客姓名,例如:Graham, Miss. Margaret EdithBehr, Mr. Karl Howell

此处的标题为Mr.Miss.

title_search = re.search(' ([A-Za-z]+).', name) 

上面的代码行搜索具有标题的名称。 先生和 不是唯一的人,例如, 博士,教授 等等。由于我们事先不知道标题是什么,但我们知道模式,即“字母加句号” ,因此我们仅查找这些单词。

([A-Za-z]+).的意思是,寻找以A-Z或a-z开头并以句号结尾的任何单词。

我建议您阅读正则表达式。