这是如何工作的? 我知道给定movie_dataset背后的直觉(使用panda将其加载到“ md”中,然后在“ votecount”中找到不为空的行并将其转换为int。
但是我不理解语法。
答案 0 :(得分:1)
md[md['vote_count'].notnull()]
返回当前md
数据帧的过滤视图,其中vote_count
不为NULL。正在将其设置为变量vote_counts
,即Boolean Indexing。
# Assume this dataframe
df = pd.DataFrame(np.random.randn(5,3), columns=list('ABC'))
df.loc[2,'B'] = np.nan
当您执行df['B'].notnull()
时,它将返回一个布尔向量,可用于过滤值为True的数据
df['B'].notnull()
0 True
1 True
2 False
3 True
4 True
Name: B, dtype: bool
df[df['B'].notnull()]
A B C
0 -0.516625 -0.596213 -0.035508
1 0.450260 1.123950 -0.317217
3 0.405783 0.497761 -1.759510
4 0.307594 -0.357566 0.279341