我有一个大约5000个重复措施的数据文件,其中包含ID的行以及针对儿童的重量,BMI等的重复测量。我想找到每个人的一个变量(BMI)的最大值(最多9个记录)。如何在每个ID的多行上查找并返回每个人的最大值?
一个非常简短的例子如下: HAVE:
ID Date BMI
1 1 20
1 2 18
1 3 24
2 4 23
2 5 19
2 6 17
3 7 25
3 8 18
3 9 21
WANT
ID Highest BMI Corresponding date
1 24 3
2 23 4
3 25 7
或者,如果有办法在SPSS或JMP中执行此操作(我现在无法访问SAS),请告知我们。 谢谢! 梅丽莎
答案 0 :(得分:1)
您可以在Excel中分两部分轻松完成此操作
第1部分 - 数据透视表
使用
创建数据透视表ID
Max of BMI
见下文
第2部分 - 匹配日期
在tge第一个BMI最右边的单元格中,放入此公式=SUMPRODUCT(--($A$2:$A$10=B14),--($C$2:$C$10=C14),$B$2:$B$10)/SUMPRODUCT(--($A$2:$A$10=B14),--($C$2:$C$10=C14))
(如果它们与此示例不同,请确保重新映射范围)
此公式是与ID和最大BMI匹配的记录