通过在熊猫的另一列中拆分字符串来创建新的数据框列

时间:2018-09-28 21:19:07

标签: python string pandas dataframe split

我正在尝试分解数据框中的某些数据,例如:

Index   Name
0       joe bloggs
1       jane doe
2       first last

我想创建一个新列,仅以姓氏为例。

我觉得我应该按照df['New_name'] = df['Name'].split()的方式做一些事情,但是我知道那是行不通的。

任何帮助,我们将不胜感激,

3 个答案:

答案 0 :(得分:1)

df['New_name'] = df['Name'].str.split(expand =True)[1]得到第二个单词。如果您想确保得到最后一个单词,df['New_name'] = df['Name'].apply(lambda x: x.split()[-1])可以使用。

答案 1 :(得分:1)

pandas系列中的字符串处理有点奇怪。

df1['firstname'],df1['lastname']=df1['name'].str.split().str

答案 2 :(得分:1)

这也应该达到目的:

df['Name'].str.split(' ').str[-1]

0    bloggs
1       doe
2      last