在Stata中修剪数据

时间:2013-08-05 13:54:42

标签: stata trim

我有一个数据集,想要在一端丢弃1%的数据。例如,我有3000个观察,我想放弃30个最高的观察。是否有这种修剪的命令?顺便说一下,我是Stata的新手。

3 个答案:

答案 0 :(得分:1)

如果你知道掉落的截止点,你可以使用:

drop if var1>300

会删除var1超过300的所有行。

您可以使用summarize var1, detail获取关键百分位数:它会为您提供1%和99%的百分位数以及其他标准百分位数。

答案 1 :(得分:1)

您可以在Stata中使用_pctile

sysuse auto, clear
_pctile weight, nq(100)
return list  #this is optional 
drop if weight>r(r99) #top 1 percent 

答案 2 :(得分:0)

要在stata中选择30个顶级观察,请使用以下命令:

keep  if (_n<=30 )

要在stata中删除前30个观察值,请使用以下命令

keep if (_n>30)