import pandas as pd
#Read File
contacts_file = pd.read_excel("Contacts_Sheet.xlsx", sheet_name="Sheet1", email=[1])
#Get emails
real_email = contacts_file["@" in contacts_file["Company Email:"]]
#Output Doc
real_email.to_excel("All_emails.xlsx")
我有一个包含电子邮件和公司名称的电子表格,但是有很多公司找不到电子邮件,并且位置为“ NA”。我想创建一个程序,该程序将删除第2列中的所有电子邮件,并在第1列中包含公司名称,但是我无法弄清楚如何“搜索”电子邮件。我的想法是在每个字符串中找到“ @”,因为这是区分电子邮件与其他字符串的唯一方法。这就是我在上面的代码中试图做的。
答案 0 :(得分:0)
您需要str.contains
即
df = pd.DataFrame({'Company' : ['A','B'],
'Email' : ['test@test.com',np.nan]})
print(df)
Company Email
0 A test@test.com
1 B NaN
df_new = df[df['Email'].str.contains('@')==True]
print(df_new)
Company Email
0 A test@test.com