vote_counts = md [md ['vote_count']。notnull()] ['vote_count']。astype('int')

时间:2018-12-17 10:55:38

标签: pandas notnull

这是如何工作的? 我知道给定movie_dataset背后的直觉(使用panda将其加载到“ md”中,然后在“ votecount”中找到不为空的行并将其转换为int。

但是我不理解语法。

1 个答案:

答案 0 :(得分:1)

md[md['vote_count'].notnull()]返回当前md数据帧的过滤视图,其中vote_count不为NULL。正在将其设置为变量vote_counts,即Boolean Indexing

# Assume this dataframe
df = pd.DataFrame(np.random.randn(5,3), columns=list('ABC'))
df.loc[2,'B'] = np.nan

当您执行df['B'].notnull()时,它将返回一个布尔向量,可用于过滤值为True的数据

df['B'].notnull()

0     True
1     True
2    False
3     True
4     True
Name: B, dtype: bool


df[df['B'].notnull()]

         A          B           C
0   -0.516625   -0.596213   -0.035508
1   0.450260    1.123950    -0.317217
3   0.405783    0.497761    -1.759510
4   0.307594    -0.357566   0.279341