鉴于我在“train”数据集中有一个“Name”列,我想从中提取标题,将其添加到新创建的列“Title”中。
我考虑过使用re.search("([A-Za-z]+)\.")
,但我不确定如何遍历整个列并在之后将其传递给新列。
提前感谢您的帮助。
答案 0 :(得分:1)
您可以使用以下代码:
import pandas as pd
df=pd.DataFrame([['Braund, Mr. Owen Harris'],['Cumings, Mrs. John Bradley'],
['Heikkinen, Miss. Laina'],['Futrellem, Mrs. Jacques Heath'],
['Allen, Mr. William Henry']],
columns=['Name'])
df['title']=df['Name'].apply(lambda s:s.split(',')[1].split('.')[0])
答案 1 :(得分:0)
试试这个
df - 列名为
的数据框<p> {{ myJson['Key'].toLowerCase() }} </p>
它将在您的df
中创建新列标题