我有一个数据集,想要在一端丢弃1%的数据。例如,我有3000个观察,我想放弃30个最高的观察。是否有这种修剪的命令?顺便说一下,我是Stata的新手。
答案 0 :(得分:1)
如果你知道掉落的截止点,你可以使用:
drop if var1>300
会删除var1
超过300的所有行。
您可以使用summarize var1, detail
获取关键百分位数:它会为您提供1%和99%的百分位数以及其他标准百分位数。
答案 1 :(得分:1)
您可以在Stata中使用_pctile
。
sysuse auto, clear
_pctile weight, nq(100)
return list #this is optional
drop if weight>r(r99) #top 1 percent
答案 2 :(得分:0)
要在stata中选择30个顶级观察,请使用以下命令:
keep if (_n<=30 )
要在stata中删除前30个观察值,请使用以下命令
keep if (_n>30)