我总结了一个数据集,其中包含大约100万行的5个类别变量。我最初尝试使用PROC MEANS,但一直收到内存警告,这个过程耗尽了。我最后只使用带有GROUP BY语句的PROC SQL,整个过程只需要大约10秒钟。他们为什么会有这样的表现差异?我的理解是PROC MEANS只是在后台创建一个SQL语句,所以我假设这两种方法非常相似。
答案 0 :(得分:0)
如果您更喜欢proc
表示法,则还可以使用proc summary
代替proc means
或proc sql
,因为它与proc means
几乎完全相同,但由于某种原因它使用更少的内存。
不确定为什么会这样,但我知道过去我通过将代码从proc means
切换到proc summary
来避免内存问题。