我已经导入了一个CSV文件,其中包括grad_year,grad_major,grad_gender,gpa等研究生数据……
目的是查找所有最初声明的毕业生专业与完成课程后的毕业生专业都相同(分别为original_major和grad_major)的所有实例
我认为我想对了,但是我不确定是否要使用以下代码对空值进行计数,如果可能的话,我想从计数中消除空值
import pandas as pd
grads_df = pd.read_csv('Users/Sas0908/Downloads/grads.csv')
major_same = (grads_df['original_major'] == grads_df['grad_major']).sum()
答案 0 :(得分:0)
您可以使用nansum代替sum(https://docs.scipy.org/doc/numpy-1.15.0/reference/generated/numpy.nansum.html)
import pandas as pd
import numpy as np
grads_df = pd.read_csv('Users/Sas0908/Downloads/grads.csv')
major_same = np.nansum((grads_df['original_major'] == grads_df['grad_major']))