Python Excel电子表格阅读

时间:2020-07-10 12:46:06

标签: python excel

import pandas as pd
    
#Read File
contacts_file = pd.read_excel("Contacts_Sheet.xlsx", sheet_name="Sheet1", email=[1])
    
#Get emails
real_email = contacts_file["@" in contacts_file["Company Email:"]]
    
#Output Doc
real_email.to_excel("All_emails.xlsx")

我有一个包含电子邮件和公司名称的电子表格,但是有很多公司找不到电子邮件,并且位置为“ NA”。我想创建一个程序,该程序将删除第2列中的所有电子邮件,并在第1列中包含公司名称,但是我无法弄清楚如何“搜索”电子邮件。我的想法是在每个字符串中找到“ @”,因为这是区分电子邮件与其他字符串的唯一方法。这就是我在上面的代码中试图做的。

1 个答案:

答案 0 :(得分:0)

您需要str.contains

df = pd.DataFrame({'Company' : ['A','B'],
             'Email'  : ['test@test.com',np.nan]})

print(df)

  Company          Email
0       A  test@test.com
1       B            NaN

df_new = df[df['Email'].str.contains('@')==True]

print(df_new)

      Company          Email
    0       A  test@test.com
相关问题