我有一个正在处理的数据集,并且在某些插槽中有No
个值而不是NaN
,所以我不能使用dropna
方法。我相信有一种在整个数据集中查找特定值并对其执行操作的特定方法,但我不知道该怎么做。
这是我正在使用的csv。
https://raw.githubusercontent.com/ryanleeallred/datasets/master/messy-data.csv
答案 0 :(得分:3)
您可以将No
替换为nan
,然后使用dropna
import numpy as np
df = pd.DataFrame({'a':['Yes','No','No','Yes']})
df = df.replace('No',np.nan)
df.dropna()
输出:
a
0 Yes
3 Yes