如何使用熊猫从电子邮件地址中提取域名

时间:2018-10-29 11:27:38

标签: pandas python-3.6

我不知道从熊猫的电子邮件地址中提取域部分。如果是“ kkk@gmail.com”,我想获取“ gmail.com”。

请给我一个主意。

2 个答案:

答案 0 :(得分:1)

我相信您需要split并通过建立索引来选择列表的第二个值:

df = pd.DataFrame({'email':['kkk@gmail.com','aa@yahoo.com']})

df['domain'] = df['email'].str.split('@').str[1]
#faster solution if no NaNs values 
#df['domain'] = [x.split('@')[1] for x in df['email']]
print (df)
           email     domain
0  kkk@gmail.com  gmail.com
1   aa@yahoo.com  yahoo.com

答案 1 :(得分:0)

这也可以使用lambda函数完成。

df = pd.DataFrame({'email':['aaa@gmail.com','bbb@yahoo.com', 'ccc@aol.com']})

df['domain'] = df['email'].apply(lambda x: x.split('@')[1])