我不知道从熊猫的电子邮件地址中提取域部分。如果是“ kkk@gmail.com”,我想获取“ gmail.com”。
请给我一个主意。
答案 0 :(得分:1)
我相信您需要split
并通过建立索引来选择列表的第二个值:
df = pd.DataFrame({'email':['kkk@gmail.com','aa@yahoo.com']})
df['domain'] = df['email'].str.split('@').str[1]
#faster solution if no NaNs values
#df['domain'] = [x.split('@')[1] for x in df['email']]
print (df)
email domain
0 kkk@gmail.com gmail.com
1 aa@yahoo.com yahoo.com
答案 1 :(得分:0)
这也可以使用lambda函数完成。
df = pd.DataFrame({'email':['aaa@gmail.com','bbb@yahoo.com', 'ccc@aol.com']})
df['domain'] = df['email'].apply(lambda x: x.split('@')[1])