我有一个提供电子邮件列表的数据框(sample_emails),我只想从电子邮件中提取工作场所。例如,从诸如person1@uber.com之类的电子邮件中,它应仅返回字符串“ uber”。我尝试为此编写代码,但不断出现各种错误。
extract_company = extract_company.find(email[ start['@', end['.']]
def extract_company(email):
return
提取的值应返回到df extract_company
答案 0 :(得分:0)
使用pandas.Series.str.extract
:
import pandas as pd
extract_company = pd.Series(['a@google.com', 'b@facebook.com'])
extract_company.str.extract('@(.+)\.')
输出:
0
0 google
1 facebook
然后您可以将其分配回您的df
,例如:
df['extract_company'] = extract_company.str.extract('@(.+)\.')