嗨,我正试图删除数据集的最大示例,但我不知道该怎么做。
我使用以下代码获取数据:
df_ae.nlargest(30, 'minimum_nights')
我想删除,因为这是数据集中的异常值,我不想使用会降低特定百分比的公式。
如何删除此数据?
谢谢
答案 0 :(得分:1)
一种可能的方法:
df_ae.drop(index=df_ae.nlargest(30, 'mininimum_nights').index, inplace=True)
请注意,在您的keep='all'
中添加选项nlargest
可能会很好。