Question

我有一个像这样的数据集

data test;
    do i = 1 to 100;
    x1 = ceil(ranuni(0) * 100);
    x2 = floor(ranuni(0) * 1600);
    x3 = ceil(ranuni(0) * 1500);
    x4 = ceil(ranuni(0) * 1100);
    x5 = floor(ranuni(0) * 10);
    output;
    end;
run;

data test_2;
    set test;

    if mod(x1,3) = 0 then x1 = .;
    if mod(x2,13) = 0 then x2 = .;
    if mod(x3,7) = 0 then x3 = .;
    if mod(x4,6) = 0 then x4 = .;
    if mod(x5,2) = 0 then x5 = .;
    drop i;
run;

我计划计算一些百分位数，包括两个非标准百分位数（第2.5个和第97.5个）。我使用proc stdize进行以下操作

PROC STDIZE 
    DATA=test_2
    OUT=_NULL_
    NOMISS 
    PCTLMTD=ORD_STAT
    pctldef=3
    OUTSTAT=STDLONGPCTLS
    pctlpts=(2.5 5 25 50 75 95 97.5);
    VAR _NUMERIC_;
RUN;

与proc手段相比

DATA TEST_MEANS;
    SET TEST_2;
    IF NOT MISSING(X1);
    IF NOT MISSING(X2);
    IF NOT MISSING(X3);
    IF NOT MISSING(X4);
    IF NOT MISSING(X5);
RUN;

PROC MEANS 
    DATA=TEST_MEANS NOPRINT; 
    VAR _NUMERIC_;
    OUTPUT OUT=MEANSWIDEPCTLS P5= P25= P50= P75= P95= / AUTONAME;
RUN;

但是，与SAS如何将缺失值标记为-inf有关，当我将上面的结果与excel和proc表示的结果进行比较时，它们没有对齐，有人可以确认哪一个是正确的吗？< / p>

Answer 1

您在PROC STDIZE中使用pctldef = 3，但是PROC MEANS的默认定义为5。我使用PROC MEANS以PCTLDEF = 3测试了您的代码，并获得了匹配的结果。

proc std会为百分位数产生错误的值

1 个答案: