查找所有出现的情况,其中一列中的值与NULL值以外的其他列相同

时间:2019-09-11 03:05:54

标签: python pandas

我已经导入了一个CSV文件,其中包括grad_year,grad_major,grad_gender,gpa等研究生数据……

目的是查找所有最初声明的毕业生专业与完成课程后的毕业生专业都相同(分别为original_major和grad_major)的所有实例

我认为我想对了,但是我不确定是否要使用以下代码对空值进行计数,如果可能的话,我想从计数中消除空值

import pandas as pd 

grads_df = pd.read_csv('Users/Sas0908/Downloads/grads.csv')

major_same = (grads_df['original_major'] == grads_df['grad_major']).sum()

1 个答案:

答案 0 :(得分:0)

您可以使用nansum代替sum(https://docs.scipy.org/doc/numpy-1.15.0/reference/generated/numpy.nansum.html

import pandas as pd 
import numpy as np

grads_df = pd.read_csv('Users/Sas0908/Downloads/grads.csv')
major_same = np.nansum((grads_df['original_major'] == grads_df['grad_major']))